El aprendizaje supervisado es un enfoque fundamental en el aprendizaje automático (AM), en el que los algoritmos aprenden a partir de datos etiquetados para hacer predicciones o tomar decisiones. En este método, se proporciona al algoritmo un conjunto de datos que incluye tanto los datos de entrada como la salida correcta correspondiente, conocidos como etiquetas. El objetivo es que el algoritmo aprenda una función de mapeo que prediga con precisión la salida para nuevos datos de entrada no vistos. Este proceso de aprendizaje implica ajustar los parámetros del modelo para minimizar la diferencia entre sus predicciones y las etiquetas reales de los datos de entrenamiento.
Conceptos clave del aprendizaje supervisado
El aprendizaje supervisado se basa en varios conceptos clave:
- Datos etiquetados: La base del aprendizaje supervisado son los datos de entrenamiento, que consisten en pares de entrada-salida. La entrada suele ser un conjunto de características, y la salida es la etiqueta deseada o variable objetivo.
- Proceso de entrenamiento: Durante el entrenamiento, el algoritmo ajusta iterativamente sus parámetros internos para mejorar su capacidad de predecir la salida correcta para la entrada dada. Esto se consigue a menudo utilizando algoritmos de optimización como el descenso gradiente.
- Evaluación del modelo: Tras el entrenamiento, el rendimiento del modelo se evalúa utilizando un conjunto de datos distinto, llamado datos de validación o datos de prueba. Esto ayuda a evaluar lo bien que el modelo se generaliza a datos nuevos no vistos. Las métricas de evaluación habituales son la exactitud, la precisión, la recuperación y la puntuación F1.
Tipos de aprendizaje supervisado
Las tareas de aprendizaje supervisado se clasifican a grandes rasgos en dos tipos principales:
- Clasificación: En la clasificación, la variable de salida es categórica, lo que significa que pertenece a una clase o categoría específica. Por ejemplo, clasificar los correos electrónicos como spam o no spam es un problema de clasificación binaria, mientras que identificar la raza de un perro a partir de una imagen es un problema de clasificación multiclase. Obtén más información sobre la clasificación de imágenes y explora cómo Ultralytics YOLO puede utilizarse para tareas de clasificación de imágenes.
- Regresión: En la regresión, la variable de salida es continua, lo que significa que puede tomar cualquier valor dentro de un rango. Por ejemplo, predecir el precio de la vivienda basándose en características como el tamaño, la ubicación y la antigüedad es una tarea de regresión.
Aplicaciones reales del aprendizaje supervisado
El aprendizaje supervisado potencia una amplia gama de aplicaciones del mundo real en diversos sectores:
- Medicina: Los modelos de aprendizaje supervisado pueden ayudar en el diagnóstico médico analizando los datos de los pacientes y prediciendo la probabilidad de enfermedades. Por ejemplo, entrenar un modelo en imágenes médicas etiquetadas con la presencia o ausencia de tumores puede ayudar en la detección precoz del cáncer. Explora más sobre la IA en la sanidad para ver cómo la IA de visión está transformando el diagnóstico y el tratamiento médicos.
- Finanzas: En el sector financiero, el aprendizaje supervisado se utiliza para la detección del fraude, la puntuación crediticia y el comercio algorítmico. Por ejemplo, se puede entrenar un modelo con datos históricos de transacciones etiquetadas como fraudulentas o legítimas para identificar transacciones potencialmente fraudulentas en tiempo real. Más información sobre cómo la IA está afectando a las finanzas a través de la automatización, los servicios personalizados y la mejora de la seguridad.
- Coches autoconducidos: El aprendizaje supervisado es crucial para entrenar a los coches autoconducidos. Los modelos aprenden a reconocer objetos como peatones, otros vehículos y señales de tráfico a partir de imágenes y vídeos etiquetados, lo que permite al coche circular con seguridad.
- El comercio minorista: El aprendizaje supervisado puede utilizarse para tareas como la gestión de inventarios y la prevención de robos. Los modelos pueden entrenarse para reconocer comportamientos de hurto o hacer un seguimiento de los niveles de inventario en tiempo real.
Aprendizaje supervisado frente a otros paradigmas de aprendizaje
El aprendizaje supervisado es uno de los diversos paradigmas de aprendizaje en el aprendizaje automático. A menudo se contrapone a:
- Aprendizaje no supervisado: A diferencia del aprendizaje supervisado, el aprendizaje no supervisado trata con datos no etiquetados. El objetivo es descubrir patrones ocultos, estructuras o relaciones en los datos sin ninguna etiqueta de salida predefinida. Entre las técnicas habituales de aprendizaje no supervisado están la agrupación y la reducción de la dimensionalidad.
- Aprendizaje por Refuerzo: En el aprendizaje por refuerzo, un agente aprende a tomar decisiones interactuando con un entorno y recibiendo retroalimentación en forma de recompensas o penalizaciones. Este tipo de aprendizaje se utiliza a menudo en escenarios en los que un agente necesita aprender una política o estrategia óptima, como en los juegos o la robótica.
- Aprendizaje Semisupervisado: Este enfoque combina elementos tanto del aprendizaje supervisado como del no supervisado. Aprovecha una pequeña cantidad de datos etiquetados junto con una mayor cantidad de datos sin etiquetar para mejorar la precisión del aprendizaje. Puede ser especialmente útil cuando obtener datos etiquetados es caro o lleva mucho tiempo.
Para profundizar en estos conceptos y otros, visita el glosarioUltralytics para estar a la última con definiciones expertas de las tecnologías de IA y visión.