Glosario

Clasificación de imágenes

Descubre la clasificación de imágenes con Ultralytics YOLO : entrena modelos personalizados para la sanidad, la agricultura, el comercio minorista y más, utilizando herramientas de vanguardia.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La clasificación de imágenes es una tarea fundamental de la Visión por Computador (VC ) que consiste en asignar una única etiqueta o categoría a toda una imagen basándose en su contenido visual. Es una capacidad fundamental dentro de la Inteligencia Artificial (IA), que permite a las máquinas comprender y categorizar imágenes de forma similar a como los humanos reconocen escenas u objetos. Impulsada por técnicas de Aprendizaje Automático (AM) y, en particular, de Aprendizaje Profundo (AD), la clasificación de imágenes pretende responder a la pregunta: "¿Cuál es el sujeto principal de esta imagen?". Esta tarea sirve de base para muchos problemas de comprensión visual más complejos.

Cómo funciona la clasificación de imágenes

El proceso suele implicar el entrenamiento de un modelo, a menudo un tipo especializado de red neuronal llamada Red Neuronal Convolucional (CNN), en un gran conjunto de datos de imágenes etiquetadas. Los famosos conjuntos de datos como ImageNet, que contiene millones de imágenes en miles de categorías, se utilizan habitualmente para entrenar modelos robustos. Durante el entrenamiento, el modelo aprende a identificar patrones y rasgos distintivos -como texturas, formas, bordes y distribuciones de color- que caracterizan a las distintas categorías. Frameworks como PyTorch y TensorFlow proporcionan las herramientas y bibliotecas necesarias para construir y entrenar estos modelos de aprendizaje profundo. Puedes explorar varios conjuntos de datos de clasificaciónUltralytics , como CIFAR-100 o MNIST, para iniciar tus propios proyectos. El objetivo final es que el modelo entrenado prediga con exactitud la etiqueta de clase de imágenes nuevas no vistas previamente. Para una comprensión técnica más profunda de los mecanismos subyacentes, recursos como el curso CS231n de Stanford sobre Redes Neuronales Convolucionales para el Reconocimiento Visual ofrecen material exhaustivo.

Diferencias clave con otras tareas de visión

La clasificación de imágenes se centra en asignar una etiqueta única y global a toda la imagen. Esto la diferencia de otras tareas habituales de visión por ordenador:

  • Detección de objetos: Esta tarea va un paso más allá, ya que no sólo clasifica los objetos dentro de una imagen, sino que también los localiza, normalmente dibujando recuadros delimitadores alrededor de cada instancia detectada. Responde a la pregunta "¿Qué objetos hay en esta imagen y dónde están situados?".
  • Segmentación de imágenes: Se trata de clasificar cada píxel de la imagen.
    • Segmentación semántica asigna una etiqueta de clase (por ejemplo, "coche", "carretera", "cielo") a cada píxel, sin distinguir entre diferentes instancias de la misma clase.
    • Segmentación de instancias distingue entre instancias individuales de objetos, asignando un identificador único a los píxeles pertenecientes a cada objeto separado (por ejemplo, etiquetando "coche 1", "coche 2").

Comprender estas diferencias es crucial para seleccionar la técnica adecuada para un problema concreto, ya que cada tarea proporciona un nivel de detalle diferente sobre el contenido de la imagen.

Aplicaciones en el mundo real

La clasificación de imágenes se utiliza ampliamente en diversos ámbitos debido a su eficacia para categorizar la información visual:

Clasificación de imágenes con Ultralytics

Los modelosYOLO Ultralytics , aunque son famosos por la detección de objetos, también demuestran un gran rendimiento en tareas de clasificación de imágenes. Arquitecturas de última generación como Ultralytics YOLO11 pueden entrenarse o ajustarse fácilmente para la clasificación utilizando el intuitivo paquetePython Ultralytics o la plataforma sin código Ultralytics HUB. Estas herramientas proporcionan recursos completos, como consejos para el entrenamiento del modelo y documentación clara, como la guía sobre cómo utilizar Ultralytics YOLO11 para la clasificación de imágenes. Para seguir practicando, plantéate explorar los tutoriales de clasificaciónPyTorch o participar en los concursos de clasificación de imágenes de Kaggle. Para estar al día de los últimos avances en investigación, recursos como Papers With Code son de gran valor. También puedes comparar el rendimiento del modelo YOLO con puntos de referencia estándar.

Leer todo