Глоссарий

Семантическая сегментация

Открой для себя силу семантической сегментации - классифицируй каждый пиксель на изображениях для точного понимания сцены. Изучи приложения и инструменты прямо сейчас!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Семантическая сегментация - фундаментальная задача компьютерного зрения (КВ), которая заключается в присвоении каждой отдельной пиксельной метке в изображении определенной классовой метки. В отличие от других задач зрения, которые могут идентифицировать объекты или классифицировать все изображение, семантическая сегментация обеспечивает плотное, на уровне пикселей, понимание содержания сцены. Это значит, что она не просто определяет наличие автомобиля, а точно определяет , какие пиксели относятся к категории автомобилей, отличая их от пикселей, относящихся к дороге, небу или пешеходам. Его цель - разделить изображение на значимые области, соответствующие различным категориям объектов, обеспечивая комплексное понимание визуальной среды.

Как работает семантическая сегментация

Основная цель семантической сегментации - отнести каждый пиксель изображения к заранее определенному набору категорий. Например, на изображении, содержащем несколько автомобилей, пешеходов и деревьев, модель семантической сегментации обозначит все пиксели, составляющие любой автомобиль, как "автомобиль", все пиксели для любого пешехода - как "пешеход", а все пиксели для любого дерева - как "дерево". При этом все экземпляры одного класса объектов рассматриваются одинаково.

Современная семантическая сегментация в значительной степени опирается на глубокое обучение, в частности на конволюционные нейронные сети (CNN). Эти модели обычно обучаются с помощью методов контролируемого обучения, для чего требуются большие наборы данных с подробными аннотациями на уровне пикселей. Процесс заключается в подаче изображения в сеть, которая затем выдает карту сегментации. По сути, эта карта представляет собой изображение, где значение каждого пикселя (часто представленное цветом) соответствует его предсказанной метке класса, визуально разделяя различные категории, такие как "дорога", "здание", "человек" и т.д. Качество маркировки данных имеет решающее значение для обучения точных моделей.

Основные отличия от других задач сегментации

Важно отличать семантическую сегментацию от смежных задач компьютерного зрения:

Применение в реальном мире

Детальное понимание сцены, обеспечиваемое семантической сегментацией, имеет решающее значение для многих реальных приложений:

Модели и инструменты

При семантической сегментации часто используются модели глубокого обучения, в частности архитектуры, созданные на основе CNN.

Читать полностью