Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Сегментация экземпляров

Узнайте, как сегментация экземпляров позволяет обнаруживать объекты на уровне пикселей. Узнайте, как использовать Ultralytics для высокоскоростного создания масок в режиме реального времени и многого другого.

Сегментация экземпляров — это сложная техника в компьютерном зрении (CV), которая идентифицирует и определяет границы каждого отдельного объекта, представляющего интерес, на уровне пикселей в изображении. В то время как стандартное обнаружение объектов локализует элементы с помощью прямоугольных ограничивающих рамок, сегментация экземпляров углубляет анализ, создавая точную маску для каждого обнаруженного объекта. Эта возможность позволяет моделям искусственного интеллекта (ИИ) различать отдельные объекты одного и того же класса, например, разделять двух перекрывающихся людей, что обеспечивает более полное и детальное понимание визуальной сцены по сравнению с более простыми методами классификации.

Различение типов сегментации

Чтобы полностью понять полезность сегментации экземпляров, полезно отличать ее от других связанных задач обработки изображений . Каждый метод предлагает разный уровень детализации в зависимости от требований приложения.

  • Семантическая сегментация: Этот подход классифицирует каждый пиксель изображения по категории (например, «дорога», «небо», «автомобиль»). Однако он не различает отдельные объекты одной и той же категории. Если три автомобиля припаркованы рядом друг с другом, семантическая сегментация рассматривает их как одну область «автомобиль».
  • Сегментация экземпляров: этот метод рассматривает каждый объект как уникальную сущность. Он обнаруживает отдельные экземпляры и присваивает уникальную метку пикселям каждого из них . В примере с припаркованными автомобилями сегментация экземпляров создаст три отдельные маски, идентифицирующие «Автомобиль A», «Автомобиль B» и «Автомобиль C» по отдельности.
  • Паноптическая сегментация: гибридный подход, сочетающий фоновую маркировку семантической сегментации с идентификацией поддающихся подсчету объектов при сегментации экземпляров.

Механика анализа на уровне пикселей

Современные модели сегментации экземпляров обычно опираются на передовые архитектуры глубокого обучения (DL), в частности на сверточные нейронные сети (CNN). Эти сети извлекают признаки из изображения, чтобы предсказать как класс объекта, так и его пространственный контур. Исторически сложилось так, что стандартом были двухэтапные архитектуры, такие как Mask R-CNN, которые сначала предлагали области интереса, а затем уточняли их в маски.

Однако недавние достижения привели к появлению одноступенчатых детекторов, таких как YOLO26, которые выполняют обнаружение и сегментацию одновременно. Этот «сквозной» подход значительно улучшает скорость вывода в реальном времени, что позволяет применять высокоточную сегментацию к потокам видео в реальном времени на потребительском оборудовании.

Применение в реальном мире

Точные границы, обеспечиваемые сегментацией экземпляров, имеют решающее значение для отраслей, в которых понимание точной формы и положения объекта необходимо для принятия решений.

  • ИИ в здравоохранении: в медицинской диагностике жизненно важно определить точный размер и форму опухолей или поражений. Сегментация экземпляров позволяет моделям с высокой точностью выделять аномалии на МРТ-сканах , помогая радиологам в планировании лечения и мониторинге прогрессирования заболевания.
  • Автономные транспортные средства: Автомобили с автопилотом используют сегментацию для навигации в сложных условиях. Используя наборы данных, такие как Cityscapes, транспортные средства могут определять пригодные для движения поверхности, распознавать разметку полос движения и отделять отдельных пешеходов на переполненных пешеходных переходах для обеспечения безопасности.
  • ИИ в сельском хозяйстве: в точном земледелии сегментация используется для мониторинга здоровья растений. Роботы, оснащенные системами технического зрения, могут идентифицировать отдельные плоды для автоматической уборки урожая или detect сорняки для целенаправленного применения гербицидов, что позволяет сократить использование химикатов и оптимизировать урожайность.

Реализация сегментации с помощью Python

Разработчики могут легко реализовать сегментацию экземпляров с помощью ultralytics библиотеки. Следующий пример демонстрирует, как загрузить предварительно обученный YOLO26 модель и сгенерировать маски сегментации для изображения.

from ultralytics import YOLO

# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")

# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()

Проблемы и обучение модели

Несмотря на свою мощность, сегментация экземпляров требует больших вычислительных ресурсов по сравнению с простым обнаружением ограничивающих прямоугольников. Создание масок с идеальной точностью до пикселя требует значительных GPU и точной анотации данных. Анотация данных для этих задач включает в себя рисование плотных многоугольников вокруг каждого объекта, что может быть очень трудоемким.

Для оптимизации этого процесса команды часто используют такие инструменты, как Ultralytics , которая предлагает функции управления наборами данных, автоматической аннотации и обучения в облаке. Это позволяет разработчикам точно настраивать модели на основе пользовательских данных, таких как конкретные промышленные детали или биологические образцы, и эффективно развертывать их на периферийных устройствах искусственного интеллекта с использованием оптимизированных форматов, таких как ONNX или TensorRT.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас