Aprendizaje supervisado
Descubra cómo el aprendizaje supervisado potencia la IA con datos etiquetados, permitiendo predicciones precisas y aplicaciones como la detección de objetos y el análisis de sentimientos.
El aprendizaje supervisado es un paradigma fundamental del aprendizaje automático en el que un algoritmo aprende a partir de datos que han sido etiquetados manualmente con los resultados correctos. El objetivo principal es aprender una función de mapeo que pueda predecir el resultado de datos nuevos que no se han visto. Es como aprender con un profesor o "supervisor" que proporciona las respuestas correctas (etiquetas) durante la fase de entrenamiento. Este enfoque es la espina dorsal de muchas aplicaciones de Inteligencia Artificial (IA) de éxito, sobre todo en visión por ordenador (CV).
Cómo funciona el aprendizaje supervisado
El proceso de aprendizaje supervisado comienza con un conjunto de datos que contiene las características de entrada y las etiquetas de salida correspondientes. Este conjunto de datos etiquetados se divide en datos de entrenamiento, datos de validación y datos de prueba.
- Entrenamiento: El modelo recibe los datos de entrenamiento. Realiza predicciones para cada entrada y las compara con las etiquetas correctas.
- Corrección de errores: La diferencia entre la predicción del modelo y la etiqueta real se cuantifica mediante una función de pérdida. Un algoritmo de optimización, como el descenso gradiente, ajusta los parámetros internos del modelo, o pesos del modelo, para minimizar este error.
- Iteración: Este proceso se repite durante muchas épocas, lo que permite al modelo aprender los patrones subyacentes en los datos. El rendimiento del modelo se controla en el conjunto de validación para evitar problemas como el sobreajuste.
- Predicción: Una vez entrenado, el modelo puede hacer predicciones con datos nuevos no etiquetados. La calidad de estas predicciones se evalúa utilizando el conjunto de pruebas y las métricas de rendimiento.
Todo este flujo de trabajo se agiliza en plataformas como Ultralytics HUB, que simplifica la gestión de conjuntos de datos, la formación de modelos y la implantación.
Tipos de problemas de aprendizaje supervisado
Las tareas de aprendizaje supervisado suelen clasificarse en dos tipos principales:
- Clasificación: El objetivo es predecir una categoría discreta o etiqueta de clase. Por ejemplo, un modelo de clasificación de imágenes puede entrenarse para clasificar imágenes como "gato" o "perro". Otros ejemplos son la detección de correo basura y el análisis de opiniones. Modelos como Ultralytics YOLO pueden entrenarse para tareas de clasificación de alto rendimiento. Para más información, consulte esta introducción a la clasificación.
- Regresión: El objetivo es predecir un valor numérico continuo. Por ejemplo, un modelo podría predecir el precio de una casa basándose en características como su tamaño y ubicación. Otras aplicaciones son la previsión del precio de las acciones y la predicción de la temperatura. Encontrará una visión general de la regresión en esta guía de análisis de regresión.
Aplicaciones reales
El aprendizaje supervisado impulsa innumerables sistemas modernos de IA. He aquí dos ejemplos destacados:
- Detección de objetos en vehículos autónomos: Los coches autónomos se basan en modelos de detección de objetos para identificar y localizar peatones, otros vehículos y señales de tráfico. Estos modelos se entrenan en amplios conjuntos de datos en los que los objetos de las imágenes se etiquetan con recuadros delimitadores. A continuación, el modelo entrenado puede procesar imágenes de vídeo en tiempo real para tomar decisiones de conducción críticas. Ultralytics ofrece potentes soluciones de IA para el sector de la automoción.
- Análisis de imágenes médicas: En sanidad, los modelos de aprendizaje supervisado se utilizan para el análisis de imágenes médicas, como la detección de tumores en resonancias magnéticas o tomografías computarizadas. Los radiólogos etiquetan un gran número de exploraciones, indicando la presencia o ausencia de tumores. A continuación, se entrena una red neuronal convolucional (CNN ) con estos datos para ayudar en el diagnóstico precoz. Por ejemplo, los modelos pueden entrenarse en conjuntos de datos para la detección de tumores cerebrales.
Comparación con otros paradigmas de aprendizaje
El aprendizaje supervisado es distinto de otros paradigmas primarios de aprendizaje automático:
- Aprendizaje no supervisado: Este enfoque utiliza datos no etiquetados, en los que el algoritmo intenta encontrar patrones o estructuras por sí mismo, como agrupar puntos de datos similares(clustering) o reducir las dimensiones de los datos. No aprende una correspondencia directa entre la entrada y la salida a partir de respuestas conocidas. Lea una descripción general del aprendizaje no supervisado.
- Aprendizaje autosupervisado (SSL): Subconjunto del aprendizaje sin supervisión en el que las señales de supervisión (etiquetas) se generan automáticamente a partir de los propios datos de entrada. Se trata de una poderosa técnica para preentrenar modelos básicos en grandes cantidades de datos sin etiquetar antes de perfeccionarlos para una tarea específica.
- Aprendizaje por refuerzo: En este paradigma, un agente aprende a tomar secuencias de decisiones interactuando con un entorno y recibiendo recompensas o penalizaciones en función de sus acciones. Aprende comportamientos óptimos mediante ensayo y error, en lugar de hacerlo a partir de un conjunto de datos estáticos etiquetados. Explore una descripción general del aprendizaje por refuerzo.
En resumen, el aprendizaje supervisado es una técnica potente y ampliamente utilizada que aprovecha los datos etiquetados para entrenar modelos para tareas predictivas. Constituye la columna vertebral de muchas aplicaciones de IA exitosas, incluidas las desarrolladas y respaldadas por Ultralytics, y es una habilidad crucial para cualquier persona que trabaje en ciencia de datos o IA.