Glosario

Clasificación de imágenes

Explora los fundamentos de la clasificación de imágenes, desde las redes neuronales convolucionales (CNN) hasta los usos de la IA en el mundo real. Aprende a entrenar e implementar clasificadores de última generación con Ultralytics .

La clasificación de imágenes es una tarea fundamental en la visión por computadora (CV), en la que un modelo de aprendizaje automático analiza una imagen completa y le asigna una única etiqueta de un conjunto predefinido de categorías. Básicamente, responde a la pregunta: «¿Cuál es el tema principal de esta imagen?». Como componente central de la inteligencia artificial (IA), este proceso permite a los sistemas automatizados organizar, categorizar e interpretar datos visuales a gran escala. Aunque pueda parecer sencillo a simple vista, para que los ordenadores puedan reconocer patrones se necesitan sofisticados algoritmos de aprendizaje automático (ML) que acorten la distancia entre los píxeles sin procesar y los conceptos significativos.

El mecanismo detrás de la clasificación

La clasificación moderna de imágenes se basa en gran medida en arquitecturas de aprendizaje profundo (DL) conocidas como redes neuronales convolucionales (CNN). Estas redes están diseñadas para imitar la forma en que la corteza visual biológica procesa la información. A través de un proceso denominado extracción de características, el modelo aprende a identificar atributos de bajo nivel, como bordes y texturas, en las primeras capas, y finalmente los combina para reconocer formas y objetos complejos en capas más profundas.

Para crear un clasificador, los desarrolladores utilizan el aprendizaje supervisado, alimentando el modelo con grandes cantidades de datos de entrenamiento que contienen ejemplos etiquetados. Grandes conjuntos de datos públicos como ImageNet han sido fundamentales para mejorar la precisión de estos sistemas. Durante la fase de inferencia, el modelo genera una puntuación de probabilidad para cada categoría, a menudo utilizando una función softmax para determinar la clase más probable .

Clasificación frente a otras tareas visuales

Es importante distinguir la clasificación de imágenes de otras capacidades relacionadas con la visión artificial, ya que la elección de la técnica depende del problema específico:

Clasificación frente a detección de objetos: La clasificación asigna una etiqueta a toda la imagen. Por el contrario, la detección de objetos identifica la ubicación de múltiples objetos dentro de una escena dibujando un cuadro delimitador alrededor de cada uno de ellos.
Clasificación frente a segmentación de imágenes: Mientras que la clasificación analiza el contexto global, la segmentación proporciona precisión a nivel de píxeles. La segmentación semántica clasifica cada píxel individual, lo que permite una delimitación exacta entre los objetos y el fondo.

Aplicaciones en el mundo real

La clasificación de imágenes impulsa una amplia gama de aplicaciones de IA en el mundo real en diversos sectores:

Diagnóstico sanitario

En el campo de la medicina, los modelos de clasificación ayudan a los radiólogos mediante el análisis de exploraciones diagnósticas. Las herramientas de análisis de imágenes médicas pueden clasificar rápidamente las radiografías o resonancias magnéticas como «normales» o «anormales», o identificar afecciones específicas, como la detección de tumores, lo que permite una clasificación y un diagnóstico más rápidos de los pacientes.

Control de calidad en la fabricación

Las fábricas utilizan la inspección visual automatizada para mantener los estándares de los productos. Las cámaras de las líneas de montaje capturan imágenes de los componentes y los modelos de clasificación los etiquetan instantáneamente como «apto» o «no apto» en función de los defectos visibles. Este control de calidad automatizado garantiza que solo los artículos sin defectos lleguen a la fase de embalaje.

Agricultura inteligente

Los agricultores aprovechan la IA en la agricultura para supervisar la salud de los cultivos. Al clasificar las imágenes tomadas por drones o teléfonos inteligentes, los sistemas pueden identificar signos de enfermedades, deficiencias nutricionales o infestaciones de plagas, lo que permite intervenciones agrícolas de precisión específicas.

Implementación de la clasificación con YOLO26

El marco Ultralytics , famoso por la detección, ofrece un rendimiento de vanguardia para las tareas de clasificación de imágenes. Su arquitectura está optimizada para la velocidad y la precisión, lo que lo hace adecuado para aplicaciones en tiempo real.

A continuación se muestra un ejemplo conciso de cómo cargar un modelo preentrenado y classify imagen utilizando el ultralytics Paquete Python :

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

Para los equipos que buscan optimizar su flujo de trabajo, Ultralytics simplifica todo el proceso. Permite a los usuarios gestionar conjuntos de datos de clasificación, realizar formación basada en la nube e implementar modelos en diversos formatos, como ONNX o TensorRT sin necesidad de una amplia infraestructura de codificación.

Clasificación de imágenes

Entrene los modelosYOLO Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución de licencias empresariales flexible para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

El mecanismo detrás de la clasificación

Clasificación frente a otras tareas visuales

Aplicaciones en el mundo real

Diagnóstico sanitario

Control de calidad en la fabricación

Agricultura inteligente

Implementación de la clasificación con YOLO26

Leer más en esta categoría

12 casos de uso de imágenes aéreas impulsados por la visión artificial

¿Qué es la estimación de profundidad monocular? Una visión general

Una mirada al uso deYOLO Ultralytics para la detección de amenazas mediante IA

Únase a la comunidad Ultralytics