Descubre el poder de la segmentación de imágenes con Ultralytics YOLO . Explora la precisión a nivel de píxel, los tipos, las aplicaciones y los casos de uso de la IA en el mundo real.
La segmentación de imágenes es una técnica fundamental de la visión por ordenador (VC ) que consiste en dividir una imagen digital en varias regiones o segmentos distintos. El objetivo principal es asignar una etiqueta de clase a cada píxel de la imagen, esencialmente simplificando la representación de la imagen en algo más significativo y fácil de analizar por las máquinas. A diferencia de la detección de objetos, que identifica los objetos mediante recuadros rectangulares, la segmentación de imágenes proporciona una comprensión mucho más granular, a nivel de píxel, del contenido de la imagen, esbozando la forma exacta de los objetos. Esta precisión es crucial para las tareas que exigen un conocimiento espacial detallado.
Los algoritmos de segmentación de imágenes funcionan examinando una imagen píxel a píxel y agrupando los píxeles que comparten determinadas características -como el color, la intensidad, la textura o la ubicación espacial- en segmentos. Los primeros métodos se basaban en técnicas como el umbral, el crecimiento de regiones y la agrupación(K-Means, DBSCAN). Sin embargo, los enfoques modernos aprovechan en gran medida el aprendizaje profundo (AD), en particular las redes neuronales convolucionales (RNC). Estas redes neuronales aprenden características jerárquicas complejas directamente de los datos de entrenamiento para realizar una clasificación por píxeles. El resultado típico es una máscara de segmentación, una imagen en la que el valor de cada píxel corresponde a la etiqueta de clase a la que pertenece, resaltando visualmente los límites precisos de los objetos o regiones. Frameworks como PyTorch y TensorFlow se utilizan habitualmente para construir y entrenar estos modelos.
Las tareas de segmentación de imágenes pueden variar en función de cómo se traten los objetos y las clases:
El análisis detallado que proporciona la segmentación de imágenes permite numerosas aplicaciones:
Ultralytics YOLO como YOLOv8 y YOLO11proporcionan un rendimiento de vanguardia para tareas de segmentación de instancias, equilibrando velocidad y precisión para la inferencia en tiempo real. El marco de Ultralytics simplifica el proceso de entrenamiento de modelos de segmentación personalizados en conjuntos de datos como COCO o conjuntos de datos especializados como la segmentación de piezas de automóviles o grietas. Herramientas como Ultralytics HUB ofrecen una plataforma racionalizada para gestionar conjuntos de datos, entrenar modelos(entrenamiento en la nube disponible) y desplegarlos. Puedes explorar la documentación de la tarea de segmentación para conocer los detalles de la implementación o seguir guías como la segmentación con modelos YOLOv8 preentrenados o la segmentación de imágenes con YOLO11 en Google Colab.