El aprendizaje supervisado es una categoría fundamental del aprendizaje automático (AM) en la que los algoritmos aprenden a partir de un conjunto de datos que contiene pares de entrada-salida, conocidos como datos etiquetados. En esencia, el algoritmo es "supervisado" porque aprende comparando sus predicciones sobre los datos de entrada con las salidas correctas conocidas (etiquetas) proporcionadas en los datos de entrenamiento. El objetivo es que el algoritmo aprenda una función de mapeo que pueda predecir con precisión la salida para entradas nuevas y desconocidas. Este enfoque es fundamental para muchas aplicaciones modernas de Inteligencia Artificial (IA), ya que permite a los sistemas hacer predicciones o tomar decisiones basándose en ejemplos históricos.
Cómo funciona el aprendizaje supervisado
El proceso comienza con un conjunto de datos en el que cada punto de datos consta de características de entrada y una etiqueta de salida correcta correspondiente. Por ejemplo, en una tarea de clasificación de imágenes, las entradas serían imágenes, y las etiquetas serían las categorías a las que pertenecen (por ejemplo, "gato", "perro"). El algoritmo hace predicciones iterativas sobre los datos de entrenamiento y ajusta sus parámetros internos utilizando un algoritmo de optimización como el descenso de gradiente para minimizar la diferencia entre sus predicciones y las etiquetas reales, medida por una función de pérdida. Este entrenamiento continúa hasta que el modelo alcanza un nivel satisfactorio de precisión en los datos de validación.
Relevancia y aplicaciones
El aprendizaje supervisado es increíblemente versátil y permite una gran variedad de aplicaciones en las que los datos históricos pueden predecir acontecimientos futuros o clasificar información nueva. Su capacidad para aprender directamente de ejemplos etiquetados lo hace adecuado para tareas que requieren una gran precisión. Muchas tareas de visión por ordenador dependen en gran medida del aprendizaje supervisado, incluidas las realizadas por modelos como Ultralytics YOLO.
He aquí dos ejemplos concretos:
- Análisis de imágenes médicas: Los modelos de aprendizaje supervisado pueden entrenarse en conjuntos de datos de exploraciones médicas (como radiografías o resonancias magnéticas) etiquetadas por radiólogos. Por ejemplo, un modelo puede aprender a detectar tumores en imágenes médicas si se entrena con imágenes etiquetadas como "tumor" o "sin tumor". Esto ayuda a los médicos en el diagnóstico y la planificación del tratamiento, contribuyendo significativamente a las soluciones de IA en la atención sanitaria.
- Análisis de Sentimiento: A menudo, las empresas quieren comprender las opiniones de los clientes a partir de datos de texto, como reseñas o publicaciones en redes sociales. Se puede entrenar un modelo supervisado sobre ejemplos de texto etiquetados con sentimientos ("positivo", "negativo", "neutro"). Una vez entrenado, puede clasificar automáticamente nuevos textos, proporcionando información valiosa para la investigación de mercado y el servicio al cliente. Más información sobre el análisis de sentimientos.
Otras aplicaciones habituales son la detección de objetos en imágenes y vídeos (utilizada en vehículos autónomos y sistemas de seguridad), el filtrado de correo electrónico basura, la predicción del precio de la vivienda( tarea deregresión ) y el reconocimiento facial.
Conceptos clave
Varios conceptos son fundamentales para comprender el aprendizaje supervisado:
- Datos etiquetados: La base del aprendizaje supervisado, consistente en datos de entrada emparejados con etiquetas de salida correctas. La recopilación y anotación de datos de alta calidad son cruciales.
- Características: Variables de entrada o características mensurables utilizadas por el modelo para hacer predicciones. La ingeniería de características puede influir significativamente en el rendimiento.
- Etiquetas (u Objetivos): Los valores de salida correctos asociados a las características de entrada en los datos de entrenamiento.
- Clasificación: Un tipo de tarea de aprendizaje supervisado en la que el objetivo es predecir una etiqueta de categoría discreta (por ejemplo, clasificar correos electrónicos como "spam" o "no spam", o imágenes en diferentes clases utilizando modelos como YOLO para la clasificación).
- Regresión: Tipo de tarea de aprendizaje supervisado cuyo objetivo es predecir un valor numérico continuo (por ejemplo, predecir la temperatura, el precio de las acciones o el valor de una casa mediante algoritmos como la regresión lineal).
- Algoritmos comunes: Incluye métodos como la Regresión Logística, las Máquinas de Vectores de Soporte (SVM), los Árboles de Decisión, los Bosques Aleatorios y varios tipos de Redes Neuronales (NN), en particular las Redes Neuronales Convolucionales (CNN) para tareas relacionadas con la imagen, a menudo implementadas utilizando marcos como PyTorch.
Comparación con otros paradigmas de aprendizaje
El aprendizaje supervisado es distinto de otros paradigmas primarios de aprendizaje automático:
- Aprendizaje no supervisado: Los algoritmos aprenden patrones a partir de datos no etiquetados sin orientación explícita. Entre las tareas habituales se incluyen la agrupación (agrupar puntos de datos similares) y la reducción de la dimensionalidad (simplificar los datos). Se utiliza cuando no se dispone de datos etiquetados o el objetivo es descubrir estructuras ocultas.
- Aprendizaje por Refuerzo: Los algoritmos aprenden interactuando con un entorno y recibiendo retroalimentación en forma de recompensas o penalizaciones. El objetivo es aprender una política (una estrategia para elegir acciones) que maximice las recompensas acumuladas a lo largo del tiempo. Se utiliza a menudo en robótica, juegos y sistemas de navegación.
En resumen, el aprendizaje supervisado es una potente técnica que aprovecha los datos etiquetados para entrenar modelos para tareas predictivas, formando la columna vertebral de muchas aplicaciones de IA de éxito, incluidas las desarrolladas y respaldadas por Ultralytics y plataformas como Ultralytics HUB.