Glosario

Segmentación de imágenes

Descubre el poder de la segmentación de imágenes con Ultralytics YOLO . Explora la precisión a nivel de píxel, los tipos, las aplicaciones y los casos de uso de la IA en el mundo real.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La segmentación de imágenes es una técnica fundamental de la visión por ordenador que divide una imagen digital en varios segmentos o regiones, a menudo basándose en las características de los píxeles. El objetivo es simplificar o cambiar la representación de una imagen en algo más significativo y fácil de analizar. En lugar de limitarse a identificar objetos con cuadros delimitadores, como en la detección de objetos, la segmentación de imágenes asigna una etiqueta de clase específica a cada píxel, proporcionando una comprensión mucho más granular del contenido de la imagen. Esta comprensión a nivel de píxel es crucial para las tareas que requieren detalles espaciales precisos.

Cómo funciona la segmentación de imágenes

Los algoritmos de segmentación de imágenes analizan una imagen píxel a píxel, agrupando en segmentos los píxeles que comparten determinadas propiedades (como el color, la intensidad o la textura). Los enfoques modernos suelen utilizar el aprendizaje profundo, en particular las Redes Neuronales Convolucionales (CNN), que aprenden a identificar patrones complejos y asignan etiquetas adecuadas a cada píxel. El resultado suele ser una máscara de segmentación, que es una imagen en la que el valor de cada píxel corresponde a la clase a la que pertenece. Esta máscara resalta la forma y la ubicación exactas de los distintos objetos o regiones dentro de la imagen. Existen varias técnicas de segmentación de imágenes, desde métodos tradicionales como el umbral y la agrupación hasta modelos avanzados de aprendizaje profundo.

Tipos de segmentación de imágenes

La segmentación de imágenes puede clasificarse a grandes rasgos en función del nivel de detalle y distinción requerido:

  • Segmentación semántica: Asigna cada píxel de la imagen a una categoría predefinida (por ejemplo, "coche", "carretera", "cielo", "edificio"). No distingue entre diferentes instancias de la misma clase de objeto. Por ejemplo, a todos los coches de una imagen se les asignaría la misma etiqueta "coche" y el mismo color en la máscara de segmentación.
  • Segmentación de instancias: Va un paso más allá de la segmentación semántica. Identifica cada instancia de objeto individual dentro de una imagen y asigna una etiqueta o máscara única a cada una, aunque pertenezcan a la misma clase. Por ejemplo, cada coche distinto de una imagen recibiría su propio identificador y máscara únicos.
  • Segmentación panóptica: Combina la segmentación semántica y la segmentación por instancias. Asigna una etiqueta de clase a cada píxel (como la semántica) e identifica unívocamente cada instancia de objeto (como la instancia). Esto proporciona una comprensión global y unificada de la escena.

Aplicaciones de la segmentación de imágenes

El análisis detallado a nivel de píxel que proporciona la segmentación de imágenes permite una amplia gama de aplicaciones en diversas industrias:

  • Análisis de imágenes médicas: La segmentación es vital para analizar exploraciones médicas como TC o RM. Ayuda a identificar y delinear órganos, tejidos o anomalías como tumores con gran precisión, ayudando en el diagnóstico y la planificación del tratamiento. Por ejemplo, los modelosYOLO Ultralytics pueden utilizarse para la detección de tumores segmentando con precisión la región tumoral del tejido sano circundante, proporcionando información crítica sobre su tamaño y forma. Las técnicas comunes de imagen médica se benefician significativamente de la segmentación.
  • Vehículos autónomos: Los coches autónomos dependen en gran medida de la segmentación de imágenes para comprender su entorno. Al segmentar la carretera, las marcas de los carriles, los peatones, otros vehículos y los obstáculos a nivel de píxel, el coche puede navegar con seguridad y tomar decisiones de conducción informadas. Comprender los límites precisos de las zonas conducibles frente a las no conducibles es fundamental para alcanzar mayores niveles de automatización de la conducción.
  • Imágenes de satélite: Utilizadas en el análisis de imágenes de satélite para la cartografía de la cubierta terrestre, el seguimiento de la deforestación, la planificación urbana y la evaluación de catástrofes.
  • Agricultura: Permite técnicas de agricultura de precisión como identificar zonas de cultivo, detectar malas hierbas o evaluar la salud de las plantas basándose en regiones segmentadas. Esto respalda las aplicaciones de IA en la agricultura.
  • Comercio minorista: Analizar la disposición de las estanterías, controlar los niveles de existencias o comprender el comportamiento de los clientes mediante datos visuales segmentados.

Segmentación de imágenes y Ultralytics YOLO

Ultralytics YOLO ofrecen capacidades de vanguardia para diversas tareas de visión por ordenador, incluida la segmentación de imágenes. Los modelos como YOLOv8 están diseñados para realizar la segmentación de instancias con eficacia y precisión, lo que los hace adecuados para aplicaciones en tiempo real. Puedes obtener más información sobre las capacidades específicas de las tareas de segmentación en la documentación Ultralytics . El entrenamiento de modelos de segmentación personalizados en conjuntos de datos como el popular conjunto de datos COCO o tus propios datos se agiliza utilizando herramientas como Ultralytics HUB, que simplifica el proceso de entrenamiento, despliegue y gestión de modelos. Para obtener orientación sobre la implementación, consulta recursos como el tutorial sobre segmentación con modelos Ultralytics YOLOv8 preentrenados en Python.

Leer todo