Descubre el poder de la clasificación de imágenes en la IA, desde la sanidad al comercio minorista, con los modelos de Ultralytics YOLO y las sencillas herramientas de despliegue.
La clasificación de imágenes es una tarea fundamental de la visión por ordenador que consiste en asignar una etiqueta o categoría a toda una imagen. Este proceso permite a las máquinas identificar y clasificar el sujeto principal o la escena representada en una imagen, lo que permite una amplia gama de aplicaciones en diversos sectores. Los modelos de clasificación de imágenes se entrenan para reconocer patrones y características dentro de las imágenes, lo que les permite categorizar con precisión imágenes nuevas y no vistas basándose en sus conocimientos aprendidos.
La clasificación de imágenes se basa en varios conceptos clave del aprendizaje automático y el aprendizaje profundo. En esencia, la clasificación de imágenes suele implicar el entrenamiento de una Red Neuronal Convolucional (CNN), un tipo de red neuronal especialmente adecuada para los datos de imágenes. Las CNN pueden aprender automáticamente representaciones jerárquicas de las imágenes mediante capas de filtros que detectan patrones cada vez más complejos. Durante el entrenamiento, el modelo se alimenta de un gran conjunto de datos de imágenes etiquetadas, y ajusta sus parámetros internos para minimizar la diferencia entre sus etiquetas predichas y las etiquetas verdaderas. Este proceso suele implicar técnicas como el aumento de datos, que incrementa artificialmente el tamaño del conjunto de datos de entrenamiento aplicando transformaciones como rotaciones, giros y recortes a las imágenes existentes.
Aunque tanto la clasificación de imágenes como la detección de objetos son tareas cruciales de la visión por ordenador, tienen finalidades distintas. La clasificación de imágenes asigna una única etiqueta a toda una imagen, identificando el sujeto principal o la escena. Por ejemplo, un modelo de clasificación de imágenes puede etiquetar una imagen como "gato", "perro" o "coche". En cambio, la detección de objetos no sólo identifica la presencia de varios objetos en una imagen, sino que también los localiza mediante cuadros delimitadores. Un modelo de detección de objetos podría identificar y localizar múltiples objetos en una imagen, como un gato, un perro y un coche, cada uno con su propio cuadro delimitador. Ultralytics Los modelosYOLO son capaces de realizar tanto tareas de clasificación de imágenes como de detección de objetos, proporcionando soluciones versátiles para diversas aplicaciones de visión por ordenador. Puedes obtener más información sobre la evolución de estos modelos en La evolución de los modelos de detección de objetos y Ultralytics YOLO .
La clasificación de imágenes tiene numerosas aplicaciones en el mundo real en una amplia gama de industrias:
El entrenamiento de un modelo de clasificación de imágenes implica varios pasos, como la recogida de datos, el preprocesamiento, el entrenamiento del modelo y la evaluación. Los conjuntos de datos etiquetados de alta calidad son esenciales para entrenar modelos precisos. Una vez entrenados, los modelos pueden desplegarse utilizando diversas plataformas y herramientas. Ultralytics HUB proporciona una plataforma fácil de usar para entrenar y desplegar Ultralytics YOLO modelos, incluidos los de clasificación de imágenes. Ultralytics HUB simplifica el proceso, permitiendo a los usuarios gestionar fácilmente conjuntos de datos, entrenar modelos y desplegarlos para aplicaciones del mundo real. Puedes obtener más información sobre cómo utilizar Ultralytics YOLO11 para la clasificación de imágenes en esta guía sobre el uso de YOLO11 para la clasificación de imágenes. Además, puedes explorar los fundamentos de la clasificación de imágenes y sus aplicaciones en esta introducción a la clasificación de imágenes.
Reconocimiento de imágenes: Término más amplio que engloba tanto la clasificación de imágenes como la detección de objetos, y que implica la identificación y comprensión de objetos y escenas dentro de las imágenes. Más información sobre el reconocimiento de imágenes.
Segmentación de imágenes: Consiste en dividir una imagen en varios segmentos o regiones, cada uno de los cuales representa un objeto o parte de un objeto diferente. A diferencia de la clasificación de imágenes, que asigna una única etiqueta a toda la imagen, la segmentación de imágenes proporciona un análisis más detallado al clasificar cada píxel de la imagen. Más información sobre la segmentación de imágenes.