Descubre cómo la segmentación de instancias refina la detección de objetos con precisión a nivel de píxel, permitiendo máscaras de objetos detalladas para aplicaciones de IA.
La segmentación de instancias es una sofisticada técnica de visión por ordenador que identifica objetos dentro de una imagen y delinea los límites precisos de cada instancia individual a nivel de píxel. Esto proporciona una comprensión mucho más detallada de una escena en comparación con el simple dibujo de recuadros alrededor de los objetos, lo que permite aplicaciones avanzadas de inteligencia artificial (IA) en las que la forma y la separación exactas son cruciales.
Superando los métodos más sencillos, la segmentación por instancias genera una máscara única para cada objeto detectado, incluso si varios objetos pertenecen a la misma categoría (como identificar cada coche por separado en una foto de tráfico). Este contorno de píxeles perfectos permite a los sistemas comprender no sólo qué objetos están presentes, sino también su forma, tamaño y ubicación exactos, distinguiendo eficazmente los elementos superpuestos. Esta capacidad es vital para tareas que requieren una conciencia espacial precisa y una gran exactitud.
Es importante distinguir la segmentación de instancias de las tareas de visión por ordenador relacionadas:
La segmentación de instancias se centra específicamente en identificar y delinear objetos distintos.
Los enfoques tradicionales, como la conocida R-CNN de máscaras, suelen utilizar un proceso de dos etapas: primero detectan los objetos con cajas delimitadoras y luego generan máscaras dentro de esas cajas. Aunque es preciso, puede requerir muchos cálculos. Los métodos más modernos, de una sola etapa, incluidas las variantes de Ultralytics YOLOpredicen los recuadros delimitadores y las máscaras simultáneamente, consiguiendo un rendimiento más rápido adecuado para la inferencia en tiempo real. Estos modelos se entrenan en grandes conjuntos de datos como COCO, que incluyen anotaciones de segmentación(COCO Segmentation Dataset).
El resultado detallado de la segmentación de instancias tiene un valor incalculable en muchos campos:
Ultralytics proporciona modelos de última generación capaces de segmentar instancias con un alto rendimiento. Modelos como Ultralytics YOLOv8 y el más reciente Ultralytics YOLO11 ofrecen pesos preentrenados para tareas de segmentación y pueden entrenarse fácilmente de forma personalizada en conjuntos de datos específicos. Puedes aprender a utilizar YOLO11 para la segmentación de instancias o explorar la segmentación con modelos preentrenados de YOLOv8 . La gestión de los conjuntos de datos, el entrenamiento y el despliegue se agilizan utilizando Ultralytics HUB. Para una comparación detallada del rendimiento, consulta YOLO11 frente a YOLOv8. La documentación de la tarea de segmentación proporciona más orientación.