Глоссарий

Сегментация паноптикума

Узнай, как паноптическая сегментация объединяет семантическую сегментацию и сегментацию по экземпляру для точного понимания сцены на уровне пикселей в приложениях искусственного интеллекта.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Паноптическая сегментация - это передовая техника компьютерного зрения, предназначенная для достижения полного и детального понимания визуальной сцены на уровне пикселей. Она уникальным образом сочетает в себе сильные стороны двух других ключевых методов сегментации: семантической сегментации и сегментации по экземпляру. Основная цель паноптической сегментации - присвоить каждому пикселю изображения как метку класса (например, "автомобиль", "человек", "дорога", "небо"), так и идентификатор экземпляра (чтобы различать разные объекты одного класса), обеспечивая богатую, единую интерпретацию сцены.

Понимание унифицированного подхода

Чтобы понять суть паноптикума сегментации, полезно сравнить его с родственными задачами. Обнаружение объектов идентифицирует их с помощью ограничительных рамок, но не имеет детализации на уровне пикселей. Семантическая сегментация относит каждый пиксель к той или иной категории (например, все автомобили помечены как "автомобиль"), но не различает отдельные объекты внутри одной категории. Сегментация экземпляров решает эту проблему, обнаруживая и сегментируя каждый отдельный экземпляр объекта (например, автомобиль 1, автомобиль 2), но обычно она фокусируется на счетных объектах ("вещах") и может игнорировать фоновые области ("вещи", такие как трава, небо или дорога).

Паноптическая сегментация устраняет этот пробел, обеспечивая более целостное понимание сцены. Она присваивает семантическую метку каждому пикселю, независимо от того, принадлежит ли он к классу "вещей" (счетные объекты, такие как транспортные средства, пешеходы, животные) или к классу "вещей" (аморфные области, такие как дороги, стены, небо). Очень важно, что пикселям, принадлежащим к классам "вещей", он также присваивает уникальный идентификатор экземпляра, отделяя каждый объект от других объектов того же типа. Такая комплексная маркировка гарантирует, что ни один пиксель не останется неклассифицированным, предлагая полный разбор изображения.

Как работает паноптикум сегментации

Модели паноптической сегментации обычно опираются на архитектуры глубокого обучения. В таких моделях часто используется общий экстрактор признаков (опорная сеть), за которым следуют специализированные головки или ветви, предсказывающие семантические метки для всех пикселей и маски экземпляров для классов "вещей". Выходы этих ветвей затем интеллектуально объединяются или сливаются, чтобы получить конечную карту паноптикума, где каждый пиксель имеет как семантическую метку, так и, если применимо, идентификатор экземпляра.

Применение в реальном мире

Всестороннее понимание сцены, которое дает паноптическая сегментация, очень ценно в различных областях:

  • Автономное вождение: Для самоуправляемых автомобилей различение различных транспортных средств и пешеходов (инстанций), а также понимание дороги, тротуаров, светофоров и неба (семантического контекста) жизненно важно для безопасной навигации. Такие компании, как Waymo, и технологии вроде Tesla Autopilot во многом полагаются на сложное восприятие сцены.
  • Медицинская визуализация: В анализе медицинских изображений паноптикум сегментации позволяет точно идентифицировать и очертить отдельные клетки или опухоли (экземпляры), одновременно классифицируя окружающие ткани и фоновые структуры (семантические метки), что помогает в диагностике и планировании лечения. Такие наборы данных, как PanNuke, ориентированы на этот тип ядерной сегментации.
  • Робототехника и дополненная реальность: Понимание всего окружения, включая отдельные объекты и фоновый контекст, крайне важно для роботов, взаимодействующих со сложными пространствами, и для точного наложения цифровой информации в приложениях дополненной реальности. Робототехника получает огромную пользу от детального картографирования окружающей среды.

Паноптическое сегментирование с помощью Ultralytics

Хотя паноптическая сегментация - сложная задача, прогресс в таких моделях, как Ultralytics YOLO расширяют границы производительности сегментации. Такие модели, как Ultralytics YOLOv8 предоставляют широкие возможности для решения смежных задач сегментации изображений, формируя основу для построения более сложных систем восприятия. Пользователи могут использовать такие платформы, как Ultralytics HUB, для оптимизации рабочих процессов, включая обучение моделей на пользовательских наборах данных и изучение различных вариантов развертывания моделей.

Читать полностью