Glosario

Segmentación de instancias

Descubre cómo la segmentación de instancias refina la detección de objetos con precisión a nivel de píxel, permitiendo máscaras de objetos detalladas para aplicaciones de IA.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La segmentación de instancias es una sofisticada técnica de visión por ordenador que refina la detección de objetos, no sólo identificándolos dentro de una imagen, sino también delineando los límites precisos de cada objeto a nivel de píxel. A diferencia de los métodos más sencillos, la segmentación de instancias distingue entre instancias individuales de la misma clase de objeto, proporcionando una máscara detallada para cada objeto de la escena. Este nivel granular de comprensión lo hace inestimable para aplicaciones que requieren un reconocimiento y una separación precisos de los objetos.

¿Qué es la segmentación de instancias?

La segmentación de instancias va más allá de la detección básica de objetos, que traza cuadros delimitadores alrededor de los objetos, y de la segmentación semántica, que etiqueta cada píxel de una imagen con una clase, pero no diferencia entre objetos individuales de la misma clase. En cambio, la segmentación por instancias identifica de forma única cada instancia de objeto, incluso cuando se solapan. Por ejemplo, en una imagen con varios coches, la segmentación por instancias no sólo los reconocerá a todos como "coche", sino que creará una máscara separada y perfecta en píxeles para cada coche, distinguiéndolos entre sí y del fondo. Esta capacidad es crucial en situaciones en las que es importante contar objetos individuales o analizar sus formas específicas.

Segmentación de Instancias vs. Tareas Relacionadas

Aunque está relacionada, la segmentación de instancias difiere significativamente de otras tareas de visión por ordenador:

  • Detección de objetos: La detección de objetos se centra en identificar y localizar objetos dentro de una imagen dibujando cuadros delimitadores a su alrededor. Te dice qué objetos hay y dónde están, pero no su forma ni sus límites exactos.
  • Segmentación semántica: La segmentación semántica clasifica cada píxel de una imagen en clases predefinidas, como "cielo", "carretera" o "coche". Proporciona una comprensión de la escena a nivel de píxel, pero no diferencia entre instancias separadas de la misma clase de objeto. Por ejemplo, todos los coches se etiquetan como píxeles "coche", pero no se distinguen como objetos individuales.
  • Segmentación de instancias: La segmentación de instancias combina los puntos fuertes de ambas. Realiza una clasificación a nivel de píxel como la segmentación semántica, pero también diferencia y segmenta cada instancia de objeto individualmente, como la detección de objetos, proporcionando una comprensión completa y detallada de los objetos de una imagen.

Aplicaciones de la segmentación de instancias

La precisión de la segmentación de instancias la hace esencial en diversos campos:

  • Conducción autónoma: En los coches de conducción autónoma, la segmentación de instancias puede ayudar al vehículo a comprender su entorno identificando y siguiendo con precisión a cada peatón, vehículo y obstáculo de la carretera. Esta percepción detallada es crucial para la navegación segura y la toma de decisiones en escenarios de tráfico complejos.
  • Análisis de imágenes médicas: En sanidad, la segmentación de instancias es muy valiosa para el análisis de imágenes médicas. Puede utilizarse para segmentar con precisión células individuales, tumores u órganos de exploraciones médicas como resonancias magnéticas o tomografías computarizadas, ayudando al diagnóstico, la planificación del tratamiento y el seguimiento de la progresión de la enfermedad. Por ejemplo Ultralytics YOLOv8 puede utilizarse para la detección de tumores en imágenes médicas, aprovechando la segmentación de instancias para localizar y delinear con precisión los tumores.
  • Robótica: Para los robots que interactúan con el mundo real, la segmentación de instancias proporciona la comprensión detallada de la escena necesaria para realizar tareas complejas. Tanto si se trata de un brazo robótico que recoge artículos en un almacén como de un robot de servicio que navega por un entorno dinámico, conocer la forma y la ubicación precisas de cada objeto es fundamental para un funcionamiento eficaz y seguro.

Segmentación de instancias y Ultralytics YOLO

Ultralytics YOLO están a la vanguardia de la segmentación de instancias en tiempo real, ofreciendo modelos como Ultralytics YOLOv8 y Ultralytics YOLO11 que son capaces de realizar la segmentación de instancias con gran precisión y velocidad. Estos modelos pueden entrenarse fácilmente en conjuntos de datos personalizados y desplegarse utilizando el HUB Ultralytics para agilizar la gestión y el despliegue de modelos. Para empezar con la segmentación de instancias, puedes explorar recursos como cómo utilizar Ultralytics YOLO11 para la segmentación de inst ancias y aprender sobre la segmentación con modelos preentrenados Ultralytics YOLOv8 en Python.

Leer todo