Descubra cómo la segmentación por instancias refina la detección de objetos con precisión a nivel de píxel, lo que permite obtener máscaras de objetos detalladas para aplicaciones de IA.
La segmentación de instancias es una tarea avanzada de visión por ordenador (VC ) que identifica y delimita objetos individuales dentro de una imagen a nivel de píxel. A diferencia de otras tareas de visión, no se limita a clasificar una imagen o a dibujar un cuadro delimitador alrededor de los objetos, sino que genera una máscara precisa a nivel de píxel para cada instancia de objeto distinta. Esta técnica proporciona una comprensión mucho más profunda de una escena, ya que puede diferenciar entre objetos superpuestos de la misma clase.
Es importante distinguir la segmentación de instancias de otras tareas relacionadas con la visión por ordenador.
Los modelos de segmentación de instancias suelen realizar dos funciones principales: en primer lugar, detectan todas las instancias de objetos en una imagen y, en segundo lugar, generan una máscara de segmentación para cada instancia detectada. Este proceso fue popularizado por arquitecturas como Mask R-CNN, que amplía detectores de objetos como Faster R-CNN añadiendo una rama paralela que predice una máscara binaria para cada región de interés. Los modelos modernos han refinado aún más este proceso para mejorar la velocidad y la precisión, lo que permite la inferencia en tiempo real en muchas aplicaciones. El desarrollo a menudo se basa en potentes marcos de aprendizaje profundo como PyTorch y TensorFlow.
Los contornos detallados de los objetos que proporciona la segmentación de instancias son valiosos en numerosos campos.
Ultralytics proporciona modelos de última generación capaces de realizar una segmentación de instancias eficiente. Modelos como YOLOv8 y el último YOLO11 están diseñados para ofrecer un alto rendimiento en diversas tareas de visión, incluida la segmentación de instancias. Encontrará más información en nuestra documentación sobre la tarea de segmentación. Los usuarios pueden aprovechar modelos preentrenados o realizar ajustes finos en conjuntos de datos personalizados como COCO utilizando herramientas como la plataforma Ultralytics HUB, que simplifica el flujo de trabajo de aprendizaje automático (ML) desde la gestión de datos hasta la implementación de modelos. Para la implementación práctica, están disponibles recursos como nuestro tutorial sobre segmentación con modelos Ultralytics YOLOv8 preentrenados o nuestra guía sobre aislamiento de objetos de segmentación. También puede aprender a utilizar Ultralytics YOLO11 para la segmentación de instancias.