Glosario

Aprendizaje activo

Descubre el aprendizaje activo, un método de aprendizaje automático rentable que aumenta la precisión con menos etiquetas. Descubre cómo transforma el entrenamiento de la IA.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El aprendizaje activo es un enfoque especializado dentro del aprendizaje automático en el que el algoritmo desempeña un papel activo en la selección de los datos de los que aprende. A diferencia del aprendizaje supervisado tradicional, que se basa en conjuntos de datos completamente etiquetados, el aprendizaje activo busca de forma inteligente etiquetas en puntos de datos específicos que considera más informativos. Este enfoque selectivo permite al modelo alcanzar una gran precisión con un número significativamente menor de ejemplos etiquetados, lo que lo convierte en una estrategia rentable y eficaz para entrenar modelos de aprendizaje automático, sobre todo cuando se trata de grandes conjuntos de datos sin etiquetar.

Cómo funciona el aprendizaje activo

En el aprendizaje activo, el modelo interactúa iterativamente con un oráculo (normalmente un anotador humano) para solicitar etiquetas para los puntos de datos más valiosos. El proceso suele seguir estos pasos

  1. Entrenamiento inicial: El modelo se entrena inicialmente con un pequeño conjunto de datos etiquetados.
  2. Muestreo de incertidumbre: El modelo identifica los puntos de datos en los que tiene mayor incertidumbre sobre la etiqueta correcta. Existen varias estrategias para cuantificar la incertidumbre, como consultar las instancias con la menor confianza de predicción o en las que los distintos modelos de un conjunto están más en desacuerdo.
  3. Consulta: El modelo consulta al oráculo las etiquetas de los puntos de datos seleccionados.
  4. Actualización del modelo: Los nuevos datos etiquetados se añaden al conjunto de entrenamiento, y se vuelve a entrenar el modelo.
  5. Iteración: Los pasos 2-4 se repiten hasta que se alcanza el nivel de precisión deseado o se agota el presupuesto de etiquetado.

El aprendizaje activo es especialmente útil cuando etiquetar datos es caro, lleva mucho tiempo o requiere conocimientos especializados. Al seleccionar estratégicamente qué puntos de datos etiquetar, el aprendizaje activo minimiza el esfuerzo de etiquetado al tiempo que maximiza el rendimiento del modelo.

Beneficios clave del aprendizaje activo

El aprendizaje activo ofrece varias ventajas sobre el aprendizaje supervisado tradicional:

  • Reducción de los costes de etiquetado: Al centrarse en los puntos de datos más informativos, el aprendizaje activo reduce significativamente la cantidad de datos etiquetados necesarios para entrenar un modelo de alto rendimiento.
  • Entrenamiento más rápido: Al necesitar menos ejemplos etiquetados, el tiempo de entrenamiento puede ser considerablemente más corto, especialmente para modelos complejos.
  • Mayor precisión del modelo: El aprendizaje activo a menudo conduce a un mejor rendimiento del modelo en comparación con los modelos entrenados con datos etiquetados seleccionados al azar, ya que da prioridad a las instancias más desafiantes e informativas.
  • Uso eficiente de los recursos: El aprendizaje activo optimiza el uso de los recursos minimizando el esfuerzo dedicado a etiquetar los puntos de datos menos informativos.

Aplicaciones reales del aprendizaje activo

El aprendizaje activo encuentra aplicaciones en diversos ámbitos en los que los datos etiquetados son escasos o caros de obtener. He aquí dos ejemplos concretos:

Análisis de imágenes médicas

En el análisis de imágenes médicas, obtener anotaciones de expertos médicos puede ser costoso y llevar mucho tiempo. El aprendizaje activo puede emplearse para identificar las imágenes médicas más críticas que requieren el etiquetado de expertos, como las que tienen características ambiguas o afecciones raras. Este enfoque específico permite desarrollar modelos de diagnóstico precisos con menos imágenes etiquetadas, lo que acelera el desarrollo de herramientas médicas basadas en IA.

Detección de objetos en vehículos autónomos

Entrenar modelos de detección de objetos para vehículos autónomos requiere grandes cantidades de datos etiquetados que representen diversos escenarios de conducción. El aprendizaje activo puede ayudar a priorizar el etiquetado de los puntos de datos más difíciles para el modelo, como condiciones de iluminación inusuales, objetos ocluidos o situaciones de tráfico poco frecuentes. Esto garantiza que el modelo se entrene con los datos más informativos, lo que mejora la seguridad y la fiabilidad de los sistemas de conducción autónoma. Ésta es sólo una de las muchas aplicaciones de la visión por ordenador en los vehículos autónomos.

Aprendizaje activo frente a otros paradigmas de aprendizaje

Es importante distinguir el aprendizaje activo de otros paradigmas de aprendizaje relacionados:

  • Aprendizaje supervisado: En el aprendizaje supervisado tradicional, el modelo se entrena en un conjunto de datos fijo con etiquetas completas. El aprendizaje activo, en cambio, selecciona dinámicamente puntos de datos para etiquetarlos durante el proceso de entrenamiento.
  • Aprendizaje semisupervisado: El aprendizaje semisupervisado utiliza datos etiquetados y no etiquetados para el entrenamiento. Aunque tanto el aprendizaje activo como el aprendizaje semisupervisado pretenden aprovechar los datos no etiquetados, el aprendizaje activo busca activamente etiquetas, mientras que el aprendizaje semisupervisado suele utilizar los datos no etiquetados para mejorar la comprensión del modelo de la distribución de datos subyacente.
  • Aprendizaje por Refuerzo: El aprendizaje por refuerzo implica que un agente aprenda por ensayo y error interactuando con un entorno. A diferencia del aprendizaje activo, en el que un modelo consulta un oráculo para obtener etiquetas, el aprendizaje por refuerzo se centra en el aprendizaje de acciones óptimas basadas en recompensas y penalizaciones.

Aprendizaje activo y Ultralytics

Ultralytics ofrece soluciones de vanguardia para la detección de objetos, incluidos los potentes modelos Ultralytics YOLO . Aunque Ultralytics no ofrece actualmente soporte directo para flujos de trabajo de aprendizaje activo, los resultados y conocimientos generados por los modelos YOLO pueden aprovecharse para aplicar estrategias de aprendizaje activo. Por ejemplo, las puntuaciones de confianza del modelo para la detección de objetos pueden utilizarse para identificar instancias inciertas para su etiquetado.

Además, Ultralytics proporciona un conjunto de herramientas y recursos para entrenar, validar y desplegar los modelos YOLO . Estas herramientas pueden integrarse en conductos personalizados de aprendizaje activo para agilizar el desarrollo de sistemas de detección de objetos. Puedes explorar más a fondo estas capacidades en la página de documentaciónUltralytics .

El aprendizaje activo representa un poderoso paradigma para entrenar modelos de aprendizaje automático de forma eficiente, sobre todo cuando los datos etiquetados son escasos o caros. Al seleccionar inteligentemente los puntos de datos más informativos para el etiquetado, el aprendizaje activo reduce costes, acelera el entrenamiento y mejora la precisión del modelo. A medida que crece la demanda de soluciones de IA en diversos sectores, el aprendizaje activo está llamado a desempeñar un papel cada vez más importante en el desarrollo de sistemas de aprendizaje automático sólidos y eficientes.

Leer todo