Explora el aprendizaje supervisado en IA. Descubre cómo modelos como Ultralytics utilizan datos etiquetados para la clasificación y la regresión con el fin de obtener resultados de alta precisión.
El aprendizaje supervisado es un enfoque fundamental en la inteligencia artificial (IA) en el que los algoritmos se entrenan con datos de entrada que han sido etiquetados con la salida correcta. En este método, el modelo aprende comparando sus propias predicciones con estas etiquetas proporcionadas, esencialmente contando con un «supervisor» que lo corrige durante el proceso de entrenamiento. El objetivo principal es que el sistema aprenda la función de mapeo de entradas a salidas lo suficientemente bien como para poder predecir con precisión las etiquetas de datos de prueba nuevos y desconocidos . Esta técnica es la fuerza impulsora detrás de muchas de las aplicaciones de IA más prácticas y exitosas que se utilizan en la actualidad, desde filtros de correo electrónico no deseado hasta sistemas de conducción autónoma.
El flujo de trabajo del aprendizaje supervisado gira en torno al uso de datos etiquetados. Se crea un conjunto de datos en el que cada ejemplo de entrenamiento se empareja con una etiqueta de «verdad fundamental» correspondiente. Durante la fase de entrenamiento del modelo, el algoritmo procesa las características de entrada y genera una predicción. A continuación, una fórmula matemática denominada función de pérdida mide el error, es decir, la diferencia entre la predicción del modelo y la etiqueta real.
Para minimizar este error, un algoritmo de optimización, como el descenso estocástico de gradiente (SGD), ajusta iterativamente los parámetros internos del modelo o las ponderaciones del modelo. Este proceso se repite a lo largo de muchos ciclos, conocidos como épocas, hasta que el modelo alcanza un nivel satisfactorio de precisión sin sobreajustarse a los datos de entrenamiento . Herramientas como la Ultralytics simplifican todo este proceso gestionando la anotación, el entrenamiento y la evaluación de los conjuntos de datos en un entorno unificado.
Los problemas de aprendizaje supervisado se clasifican generalmente en dos tipos principales según la naturaleza de la variable objetivo:
El aprendizaje supervisado impulsa una amplia gama de tecnologías en diferentes sectores:
Es importante distinguir entre el aprendizaje supervisado y el aprendizaje no supervisado. Mientras que el aprendizaje supervisado se basa en pares de entrada-salida etiquetados, el aprendizaje no supervisado funciona con datos sin etiquetar. En escenarios no supervisados , el algoritmo intenta encontrar por sí mismo estructuras ocultas, patrones o agrupaciones dentro de los datos, como la segmentación de clientes en marketing. El aprendizaje supervisado suele ser más preciso para tareas específicas en las que se dispone de datos históricos , mientras que el aprendizaje no supervisado es mejor para el análisis exploratorio de datos.
El aprendizaje supervisado es fundamental para entrenar los modelos modernos de visión por computadora. El siguiente Python muestra cómo entrenar un modelo YOLO26 utilizando un conjunto de datos supervisado (COCO8). El modelo aprende a detect a partir de las imágenes etiquetadas del conjunto de datos.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
Este sencillo proceso aprovecha la potencia de PyTorch para realizar operaciones matriciales complejas y cálculos de gradientes. Para aquellos que buscan optimizar la gestión de datos, la Ultralytics ofrece herramientas para el entrenamiento basado en la nube y la autoanotación, lo que hace que el flujo de trabajo del aprendizaje supervisado sea significativamente más eficiente.