Descubre la clasificación de imágenes con Ultralytics YOLO : entrena modelos personalizados para la sanidad, la agricultura, el comercio minorista y más, utilizando herramientas de vanguardia.
La clasificación de imágenes es una tarea fundamental de la Visión por Computador (VC ) que consiste en asignar una única etiqueta o categoría a toda una imagen basándose en su contenido visual. Es una capacidad fundamental dentro de la Inteligencia Artificial (IA), que permite a las máquinas comprender y categorizar imágenes de forma similar a como los humanos reconocen escenas u objetos. Impulsada por técnicas de Aprendizaje Automático (AM) y, en particular, de Aprendizaje Profundo (AD), la clasificación de imágenes pretende responder a la pregunta: "¿Cuál es el sujeto principal de esta imagen?"
El proceso suele implicar el entrenamiento de un modelo, a menudo un tipo especializado de red neuronal llamada Red Neuronal Convolucional (CNN), en un gran conjunto de datos de imágenes etiquetadas. Famosos conjuntos de datos como ImageNet contienen millones de imágenes clasificadas en miles de clases. Durante el entrenamiento, el modelo aprende a identificar patrones y características -como texturas, formas y distribuciones de color- que distinguen las distintas categorías. Frameworks como PyTorch y TensorFlow proporcionan las herramientas para construir y entrenar estos modelos. Puedes explorar varios conjuntos de datos de clasificaciónUltralytics para iniciar tus propios proyectos. El objetivo es que el modelo entrenado prediga con exactitud la etiqueta de clase de imágenes nuevas no vistas. Para una comprensión técnica más profunda, recursos como el curso Stanford CS231n ofrecen material exhaustivo sobre las CNN.
La clasificación de imágenes se centra en asignar una única etiqueta a toda la imagen. Esto la distingue de otras tareas habituales de CV:
Comprender estas diferencias es crucial para seleccionar la técnica adecuada para un problema determinado.
La clasificación de imágenes se utiliza mucho en diversos ámbitos debido a su relativa sencillez y eficacia:
Los modelosYOLO de Ultralytics , famosos por la detección de objetos, también destacan en tareas de clasificación de imágenes. Las arquitecturas modernas como Ultralytics Y OLOv11 pueden entrenarse fácilmente para la clasificación utilizando el paquetePython Ultralytics o la plataforma sin código Ultralytics HUB. Estas herramientas proporcionan recursos completos, como consejos para el entrenamiento de modelos y documentación clara, como la guía sobre cómo utilizar Ultralytics YOLOv11 para la clasificación de imágenes. Para practicar, considera explorar los tutoriales de clasificaciónPyTorch o participar en las competiciones de clasificación de imágenes de Kaggle. Mantente al día de los últimos avances en investigación a través de recursos como Papers With Code.