Glosario

Segmentación de instancias

Descubre cómo la segmentación por instancias proporciona un reconocimiento de objetos perfecto en píxeles para aplicaciones como la conducción autónoma, las imágenes médicas y la robótica.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La segmentación de instancias es una sofisticada técnica de visión por ordenador que amplía las capacidades de detección de objetos, no sólo identificando la presencia y ubicación de los objetos dentro de una imagen, sino también delineando los límites exactos de cada instancia individual de objeto. Esto significa que la segmentación de instancias puede distinguir entre varios objetos de la misma clase que estén próximos entre sí o se solapen, proporcionando una máscara a nivel de píxel para cada objeto. Este nivel de detalle es crucial para las aplicaciones que requieren una comprensión precisa de la escena, como la conducción autónoma, las imágenes médicas y la manipulación robótica.

Diferencias clave con los términos relacionados

Aunque la segmentación de instancias está relacionada con otras tareas de visión por ordenador, ofrece capacidades únicas:

  • Detección de Objetos: La detección de objetos identifica la presencia y ubicación de objetos dentro de una imagen, normalmente utilizando cuadros delimitadores. Sin embargo, no proporciona información sobre la forma o extensión de los objetos. La segmentación de instancias va más allá, delineando los límites precisos de cada objeto.
  • Segmentación semántica: La segmentación semántica clasifica cada píxel de una imagen en una clase específica, coloreando esencialmente con el mismo color todos los píxeles que pertenecen a la misma clase. Sin embargo, no distingue entre diferentes instancias de la misma clase. Por ejemplo, todos los coches de una imagen se etiquetarían como "coche", pero no se diferenciarían los coches individuales.
  • Segmentación panóptica: La segmentación panóptica combina la segmentación semántica y la segmentación por instancias, proporcionando tanto la clasificación a nivel de píxel como la diferenciación de instancias de objetos individuales. Mientras que la segmentación panóptica ofrece una comprensión global de la escena, la segmentación por instancias se centra específicamente en distinguir instancias de objetos individuales.

Aplicaciones en el mundo real

La segmentación de instancias se utiliza en diversas aplicaciones del mundo real en las que es esencial una delimitación precisa de los objetos:

  • Conducción autónoma: En los coches de conducción autónoma, la segmentación de instancias ayuda a identificar y distinguir entre vehículos individuales, peatones y otros objetos de la carretera. Esto es crucial para tomar decisiones de conducción precisas, como mantener una distancia segura con otros coches o evitar colisiones con peatones. Por ejemplo, el sistema puede diferenciar entre varios coches en un atasco, lo que permite al vehículo navegar por escenarios complejos con seguridad.
  • Imágenes médicas: La segmentación de instancias se utiliza para identificar y segmentar células individuales, órganos o tumores en imágenes médicas como resonancias magnéticas o tomografías computarizadas. Esta precisión es vital para el diagnóstico exacto, la planificación del tratamiento y el seguimiento de la progresión de la enfermedad. Por ejemplo, segmentar tumores individuales en un escáner cerebral puede ayudar a los médicos a planificar la radioterapia o la extirpación quirúrgica con mayor precisión. Más información sobre la IA en la sanidad.

Perspectivas técnicas

Los modelos de segmentación de instancias suelen basarse en arquitecturas de detección de objetos, como las Redes Neuronales Convolucionales (CNN). Un enfoque popular consiste en utilizar un detector de dos etapas, en el que la primera propone regiones de interés (cuadros delimitadores) y la segunda refina estas regiones para producir máscaras a nivel de píxel. Mask R-CNN es un ejemplo bien conocido de este enfoque, que amplía el modelo de detección de objetos Faster R-CNN añadiendo una rama para predecir máscaras de segmentación en cada región de interés (RoI).

Herramientas y marcos

Varias herramientas y marcos soportan la segmentación de instancias, haciéndola accesible a investigadores y desarrolladores:

  • TensorFlow y PyTorch: Estos populares marcos de aprendizaje automático proporcionan los bloques de construcción para implementar modelos de segmentación de instancias. Ofrecen flexibilidad y control sobre la arquitectura del modelo y el proceso de entrenamiento. Más información sobre TensorFlow y PyTorch.
  • Ultralytics YOLO: Los modelos Ultralytics YOLO , famosos por la detección de objetos en tiempo real, también admiten tareas de segmentación de instancias. Estos modelos ofrecen un equilibrio entre velocidad y precisión, lo que los hace adecuados para aplicaciones en tiempo real.
  • Ultralytics HUB: Esta plataforma simplifica el proceso de formación y despliegue de los modelos de segmentación de instancias, permitiendo a los usuarios centrarse en su aplicación específica sin atascarse en los detalles técnicos de la implementación del modelo. Explora cómo puedes aprovecharlo con Ultralytics HUB.

Al proporcionar máscaras detalladas a nivel de píxel para cada instancia de objeto, la segmentación de instancias mejora la capacidad de los sistemas de IA para comprender el mundo visual e interactuar con él, impulsando avances en diversos campos.

Leer todo