Glosario

Segmentación de instancias

Descubre cómo la segmentación de instancias refina la detección de objetos con precisión a nivel de píxel, permitiendo máscaras de objetos detalladas para aplicaciones de IA.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La segmentación de instancias es una sofisticada técnica de visión por ordenador que identifica objetos dentro de una imagen y delinea los límites precisos de cada instancia individual a nivel de píxel. Esto proporciona una comprensión mucho más detallada de una escena en comparación con el simple dibujo de recuadros alrededor de los objetos, lo que permite aplicaciones avanzadas de inteligencia artificial (IA) en las que la forma y la separación exactas son cruciales.

Visión general

Superando los métodos más sencillos, la segmentación por instancias genera una máscara única para cada objeto detectado, incluso si varios objetos pertenecen a la misma categoría (como identificar cada coche por separado en una foto de tráfico). Este contorno de píxeles perfectos permite a los sistemas comprender no sólo qué objetos están presentes, sino también su forma, tamaño y ubicación exactos, distinguiendo eficazmente los elementos superpuestos. Esta capacidad es vital para tareas que requieren una conciencia espacial precisa y una gran exactitud.

Segmentación de Instancias Vs. Tareas Relacionadas

Es importante distinguir la segmentación de instancias de las tareas de visión por ordenador relacionadas:

La segmentación de instancias se centra específicamente en identificar y delinear objetos distintos.

Cómo funciona la segmentación de instancias

Los enfoques tradicionales, como la conocida R-CNN de máscaras, suelen utilizar un proceso de dos etapas: primero detectan los objetos con cajas delimitadoras y luego generan máscaras dentro de esas cajas. Aunque es preciso, puede requerir muchos cálculos. Los métodos más modernos, de una sola etapa, incluidas las variantes de Ultralytics YOLOpredicen los recuadros delimitadores y las máscaras simultáneamente, consiguiendo un rendimiento más rápido adecuado para la inferencia en tiempo real. Estos modelos se entrenan en grandes conjuntos de datos como COCO, que incluyen anotaciones de segmentación(COCO Segmentation Dataset).

Aplicaciones de la segmentación de instancias

El resultado detallado de la segmentación de instancias tiene un valor incalculable en muchos campos:

  1. Conducción autónoma: Segmentar con precisión a peatones, vehículos, ciclistas y líneas de carril permite a los coches autónomos comprender mejor su entorno, navegar con seguridad por escenarios de tráfico complejos y predecir los movimientos con más precisión de lo que permiten los recuadros delimitadores por sí solos. Las investigaciones de instituciones como Waymo suelen basarse en gran medida en la segmentación.
  2. Análisis de imágenes médicas: En radiología o patología, la segmentación de instancias puede delinear con precisión tumores, órganos o incluso células individuales en exploraciones (como resonancias magnéticas o tomografías computarizadas). Esto ayuda a los médicos en el diagnóstico, la planificación del tratamiento (por ejemplo, la radioterapia) y la medición de los cambios a lo largo del tiempo, contribuyendo a los avances de la IA en la asistencia sanitaria. Consulta las guías sobre el uso de YOLO11 para la detección de tumores.
  3. Robótica: Los robots que realizan tareas como recoger y colocar objetos necesitan conocer la forma exacta de los objetos para agarrarlos correctamente, sobre todo en entornos desordenados. La segmentación de instancias proporciona esta información crucial sobre la forma(IA en Robótica).
  4. Análisis de Imágenes de Satélite: Identificar y delinear edificios, campos o masas de agua individuales a partir de imágenes aéreas o de satélite ayuda en la planificación urbana, la supervisión agrícola y la evaluación medioambiental(Técnicas de Análisis de Imágenes de Satélite).

Segmentación de instancias y Ultralytics YOLO

Ultralytics proporciona modelos de última generación capaces de segmentar instancias con un alto rendimiento. Modelos como Ultralytics YOLOv8 y el más reciente Ultralytics YOLO11 ofrecen pesos preentrenados para tareas de segmentación y pueden entrenarse fácilmente de forma personalizada en conjuntos de datos específicos. Puedes aprender a utilizar YOLO11 para la segmentación de instancias o explorar la segmentación con modelos preentrenados de YOLOv8 . La gestión de los conjuntos de datos, el entrenamiento y el despliegue se agilizan utilizando Ultralytics HUB. Para una comparación detallada del rendimiento, consulta YOLO11 frente a YOLOv8. La documentación de la tarea de segmentación proporciona más orientación.

Leer todo