Сегментация экземпляров

Узнайте, как сегментация экземпляров улучшает обнаружение объектов с точностью до пикселя, позволяя создавать детальные маски объектов для приложений искусственного интеллекта.

Сегментация объектов - передовая задача компьютерного зрения (КЗ), которая позволяет идентифицировать и разграничивать отдельные объекты на изображении на уровне пикселей. В отличие от других задач компьютерного зрения, она не просто классифицирует изображение или рисует ограничительную рам ку вокруг объектов; вместо этого она генерирует точную пиксельную маску для каждого отдельного экземпляра объекта. Эта техника обеспечивает гораздо более глубокое понимание сцены, поскольку позволяет различать перекрывающиеся объекты одного класса.

Экземпляры против семантики и обнаружения объектов

Важно отличать сегментацию экземпляров от других смежных задач компьютерного зрения.

Обнаружение объектов: Эта задача определяет наличие и местоположение объектов, обычно рисуя вокруг них прямоугольные ограничительные рамки и присваивая метку класса. Она отвечает на вопрос "Что и где находится на изображении?", но не предоставляет информацию о форме.
Семантическая сегментация: Эта задача позволяет отнести каждый пиксель на изображении к определенной категории. Например, все пиксели, относящиеся к автомобилям, будут обозначены как "автомобиль", но при этом не будут различаться два разных автомобиля на изображении. Она отвечает на вопрос "К какой категории относится каждый пиксель?".
Сегментация объектов: Объединяет возможности обнаружения объектов и семантической сегментации. Он обнаруживает каждый экземпляр объекта и генерирует для него уникальную маску сегментации. На изображении с тремя автомобилями сегментация по экземплярам выдаст три отдельные маски, каждая из которых будет соответствовать определенному автомобилю.
Паноптическая сегментация: Это наиболее комплексная из задач сегментации, объединяющая семантическую сегментацию и сегментацию экземпляров. Она присваивает каждому пикселю метку класса и уникальный идентификатор экземпляра, обеспечивая полное, единое понимание сцены.

Как работает сегментация экземпляров

Модели сегментации объектов обычно выполняют две основные функции: во-первых, они обнаруживают все объекты на изображении, а во-вторых, генерируют маску сегментации для каждого обнаруженного объекта. Этот процесс был популяризирован такими архитектурами, как Mask R-CNN, которая расширяет детекторы объектов типа Faster R-CNN, добавляя параллельную ветвь, предсказывающую бинарную маску для каждой области интереса. Современные модели еще больше усовершенствовали этот процесс для повышения скорости и точности, что позволяет делать выводы в реальном времени во многих приложениях. При разработке часто используются мощные фреймворки глубокого обучения, такие как PyTorch и TensorFlow.

Применение в реальном мире

Детальные контуры объектов, которые дает сегментация экземпляров, ценны во многих областях.

Автономные транспортные средства: Самоуправляемые автомобили полагаются на сегментацию объектов для точного определения формы и местоположения отдельных пешеходов, автомобилей и велосипедистов. Такая детализация очень важна для безопасной навигации и планирования маршрута, особенно в сложных городских условиях с множеством пересекающихся объектов. Такие наборы данных, как Cityscapes, сыграли важную роль в развитии этой области.
Анализ медицинских изображений: В радиологии сегментация экземпляров используется для высокоточного определения границ опухолей, повреждений и органов на снимках КТ или МРТ. Это помогает врачам определять размер опухоли, планировать операции и отслеживать эффективность лечения. Подробнее об этом вы можете узнать из нашей статьи в блоге об использовании YOLO11 для обнаружения опухолей.
Робототехника: Роботы используют сегментацию экземпляров для понимания окружающей среды, определения конкретных объектов для захвата и более точного обхода препятствий. Это очень важно для задач в сфере производства и логистики.
Анализ спутниковых снимков: Этот метод используется для подсчета отдельных деревьев в лесу, составления карты зданий в городе или отслеживания изменений в землепользовании с течением времени с помощью данных, полученных от таких организаций, как NASA.
Сельское хозяйство: С его помощью можно идентифицировать и подсчитывать отдельные фрукты для оценки урожайности или обнаруживать конкретные сорняки для целенаправленного применения гербицидов, что является ключевой частью точного земледелия.