Узнай, как сегментация экземпляров улучшает обнаружение объектов с точностью до пикселя, позволяя создавать детальные маски объектов для приложений искусственного интеллекта.
Сегментация экземпляров - сложная техника компьютерного зрения (КВ), которая идентифицирует объекты на изображении и очерчивает точные границы каждого отдельного экземпляра на пиксельном уровне. В отличие от методов, которые только расставляют рамки вокруг объектов, сегментация экземпляров обеспечивает гораздо более детальное понимание сцены, создавая уникальную маску для каждого обнаруженного объекта, даже если они принадлежат к одному классу. Эта возможность крайне важна для продвинутых приложений искусственного интеллекта (ИИ), где важно знать точную форму, размер и пространственную протяженность отдельных объектов, особенно когда объекты накладываются друг на друга.
Модели сегментации объектов анализируют изображение, чтобы сначала найти потенциальные объекты, а затем, для каждого обнаруженного объекта, предсказать, какие пиксели принадлежат конкретному экземпляру. Традиционные подходы, такие как влиятельная архитектура Mask R-CNN, часто используют двухэтапный процесс: во-первых, они выполняют обнаружение объектов, чтобы сгенерировать предложения ограничивающих рамок, а во-вторых, они генерируют маску сегментации внутри каждой предложенной рамки. Несмотря на свою эффективность, эти методы могут быть требовательны к вычислительным ресурсам.
Более современные подходы, включая такие модели, как Ultralytics YOLOчасто используют одноступенчатые конвейеры. Эти модели одновременно предсказывают ограничительные рамки, метки классов и маски экземпляров за один проход через нейронную сеть (НС), что приводит к значительному увеличению скорости, делая их пригодными для выводов в реальном времени. Для обучения этих моделей требуются большие наборы данных с аннотациями на уровне пикселей, такие как широко используемый набор данных COCO, в частности его аннотации сегментации. В этом процессе обычно используются методы глубокого обучения (DL), использующие конволюционные нейронные сети (CNN) для изучения сложных визуальных характеристик.
Важно отличать сегментацию экземпляров от других задач по сегментации изображений:
Сегментация объектов фокусируется на обнаружении и выделении отдельных экземпляров объектов, обеспечивая высокую точность определения границ и разделения объектов.
Способность точно идентифицировать и изолировать отдельные объекты делает сегментацию экземпляров неоценимой во многих областях:
Ultralytics предоставляет современные модели, способные выполнять эффективную сегментацию экземпляров. Такие модели, как YOLOv8 и YOLO11 разработаны для обеспечения высокой производительности в различных задачах компьютерного зрения, включая сегментацию экземпляров(см. подробности задачи сегментации). Пользователи могут использовать предварительно обученные модели или проводить тонкую настройку на пользовательских наборах данных с помощью таких инструментов, как платформа Ultralytics HUB, которая упрощает рабочий процесс машинного обучения (ML) от управления данными до развертывания модели. Для практического применения доступны такие ресурсы, как учебники по сегментации с помощью предварительно обученных моделей Ultralytics YOLOv8 или руководства по выделению объектов сегментации. Также ты можешь узнать , как использовать Ultralytics YOLO11 для сегментации экземпляров. Популярные фреймворки, такие как PyTorch и TensorFlow обычно используются для разработки и развертывания этих моделей.