Глоссарий

Сегментация паноптикума

Узнай, как паноптическая сегментация объединяет семантическую сегментацию и сегментацию по экземпляру для точного понимания сцены на уровне пикселей в приложениях искусственного интеллекта.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Паноптикум сегментации - это продвинутая задача компьютерного зрения, которая направлена на обеспечение полного и последовательного понимания изображения путем присвоения каждому пикселю как метки класса, так и уникального идентификатора экземпляра. Она эффективно объединяет две основные парадигмы сегментации: семантическую сегментацию, которая маркирует каждый пиксель категорией (например, "автомобиль", "дорога", "небо"), и сегментацию экземпляров, которая идентифицирует и очерчивает отдельные экземпляры объектов (например, "автомобиль 1", "автомобиль 2"). Цель состоит в том, чтобы создать всеобъемлющую карту сцены на уровне пикселей, которая различает различные объекты одного класса, а также идентифицирует аморфные фоновые области, часто называемые "вещами" (например, дорога, небо, растительность), в сравнении со счетными "вещами" (например, автомобили, пешеходы, велосипеды). Этот целостный подход обеспечивает более богатый контекст сцены, чем только семантическая сегментация или сегментация по экземпляру.

Как работает паноптикум сегментации

Алгоритмы паноптической сегментации обрабатывают изображение для получения единой выходной карты, где каждый пиксель получает семантическую метку и, если он принадлежит к счетному объекту ("вещи"), уникальный идентификатор экземпляра. Пиксели, принадлежащие фоновым областям ("вещи"), получают ту же семантическую метку, но обычно не имеют уникальных идентификаторов экземпляра (или имеют один идентификатор для каждой категории вещей). Современные подходы часто используют глубокое обучение, в частности архитектуры на основе конволюционных нейронных сетей (CNN) или трансформеров. Некоторые методы используют отдельные ветви сетей для семантической сегментации и сегментации экземпляров, а затем объединяют результаты, в то время как другие используют сквозные модели, разработанные специально для задачи паноптики, как это было представлено в оригинальной статье "Panoptic Segmentation". Для обучения этих моделей требуются наборы данных с подробными паноптическими аннотациями, такие как COCO Panoptic dataset или Cityscapes dataset. Производительность часто измеряется с помощью метрики Panoptic Quality (PQ), которая объединяет качество сегментации и качество распознавания.

Паноптикум сегментации по сравнению со смежными задачами

Понимание различий между паноптическим сегментированием и смежными задачами компьютерного зрения крайне важно:

  • Семантическая сегментация: Присваивает каждому пикселю метку класса (например, "автомобиль", "человек", "дорога"). Она определяет категории, но не делает различий между отдельными экземплярами одной и той же категории. Например, все автомобили могут быть окрашены одинаково в выходной маске.
  • Сегментация экземпляров: Обнаружение и сегментация отдельных экземпляров объектов (например, "машина 1", "машина 2", "человек 1"). Он фокусируется на счетных "вещах" и обычно игнорирует аморфные фоновые "вещи", такие как небо или дорога, или рассматривает их как один фоновый класс. Ultralytics YOLO модели обеспечивают надежные возможности сегментации экземпляров. Ты можешь узнать больше в этом руководстве по сегментации экземпляров в сравнении с семантической сегментацией.
  • Обнаружение объектов: Определяет наличие и расположение объектов с помощью ограничительных рамок и присваивает метки классов. Она не предоставляет масок на уровне пикселей и не сегментирует фоновые области. Многие современные модели обнаружения объектов, такие как YOLOv10 и YOLO11доступны для сравнения, например YOLO11 vs YOLOv10.

Паноптическая сегментация уникальным образом сочетает в себе сильные стороны семантической сегментации и сегментации по экземплярам, обеспечивая единый результат, который сегментирует все пиксели либо на помеченные классами области фона, либо на отдельные экземпляры объектов.

Области применения паноптикума

Всестороннее понимание сцены, которое дает паноптическая сегментация, ценно в различных областях:

  • Автономные транспортные средства: Самоуправляемым автомобилям требуется полное понимание окружающей обстановки. Паноптическое сегментирование позволяет им одновременно определять дорогу, тротуары, здания ("вещи") и различать отдельные автомобили, пешеходов, велосипедистов ("вещи"), даже когда объекты пересекаются. Такое детальное восприятие крайне важно для безопасной навигации и принятия решений. Узнай, как Ultralytics вносит свой вклад в развитие ИИ в автомобильных решениях.
  • Анализ медицинских изображений: При анализе медицинских снимков, таких как МРТ или КТ, паноптическая сегментация позволяет различать различные типы тканей ("вещи"), а также идентифицировать и сегментировать конкретные экземпляры структур, такие как опухоли, поражения или отдельные клетки ("вещи"). Это помогает в диагностике, планировании лечения и наблюдении за развитием болезни. Читай об использовании YOLO11 для обнаружения опухолей.
  • Робототехника: Роботам, работающим в сложных средах, полезно понимать как планировку (стены, пол - "вещи"), так и отдельные объекты, с которыми они могут взаимодействовать (инструменты, детали, люди - "вещи"). Это помогает в навигации, манипулировании и взаимодействии человека и робота. Изучи тему искусственного интеллекта в робототехнике.
  • Дополненная реальность (AR): AR-приложения могут использовать паноптическую сегментацию для реалистичного размещения виртуальных объектов в реальной сцене, правильно обрабатывая окклюзии и взаимодействие как с фоновыми поверхностями, так и с объектами переднего плана. Ознакомься с достижениями в области AR-технологий.
  • Анализ спутниковых снимков: Используется для детального картографирования почвенно-растительного покрова, различая типы больших территорий вроде лесов или водоемов ("вещи") и отдельные строения вроде зданий или автомобилей ("предметы"). Узнай о методах анализа спутниковых снимков.

Хотя модели Ultralytics , такие как YOLO11 , обеспечивают самую современную производительность в таких задачах, как обнаружение объектов и сегментация экземпляров, паноптикум сегментации представляет собой следующий уровень комплексного понимания сцены, что крайне важно для все более сложных приложений ИИ. Ты можешь управлять и обучать модели для смежных задач с помощью таких платформ, как Ultralytics HUB.

Читать полностью