Glosario

Aprendizaje activo

Descubra el aprendizaje activo, un método de aprendizaje automático rentable que aumenta la precisión con menos etiquetas. Descubra cómo transforma la formación en IA.

El aprendizaje activo es una metodología de formación especializada en aprendizaje automático (AM) en la que un algoritmo de aprendizaje puede consultar interactivamente a un usuario o a otra fuente de información (un "oráculo") para etiquetar nuevos puntos de datos. La idea central es que si un modelo puede elegir los datos de los que aprende, puede lograr una mayor precisión con muchos menos datos de entrenamiento. Esto es especialmente valioso en ámbitos en los que el etiquetado de datos es caro, lleva mucho tiempo o requiere conocimientos especializados. En lugar de etiquetar todo un conjunto de datos a la vez, el aprendizaje activo da prioridad a las muestras más "informativas" para el etiquetado, lo que hace que el proceso de formación del modelo sea mucho más eficiente.

Cómo funciona el aprendizaje activo

El proceso de aprendizaje activo es cíclico y suele describirse como un flujo de trabajo humano en bucle. Suele seguir los siguientes pasos:

  1. Entrenamiento inicial del modelo: Un modelo, como un detector Ultralytics YOLO11, se entrena primero en un pequeño conjunto de datos etiquetados inicialmente.
  2. Consulta de datos sin etiquetar: El modelo parcialmente entrenado se utiliza para hacer predicciones sobre un gran conjunto de datos sin etiquetar. Basándose en estas predicciones, el modelo selecciona un subconjunto de muestras sobre las que tiene más "incertidumbre".
  3. Anotación humana: Estas muestras inciertas se presentan a un experto humano (el oráculo), que proporciona las etiquetas correctas.
  4. Aumento del conjunto de datos: Las muestras recién etiquetadas se añaden al conjunto de entrenamiento.
  5. Reentrenamiento: El modelo se vuelve a entrenar con el conjunto de datos actualizado. Este ciclo se repite hasta que el rendimiento del modelo alcanza el umbral deseado o se agota el presupuesto de etiquetado.

La clave de este proceso reside en la estrategia de consulta. Entre las estrategias más comunes se encuentran el muestreo de incertidumbre (selección de los casos en los que el modelo tiene menos confianza), la consulta por comité (uso de varios modelos y selección de los casos en los que no están de acuerdo) o la estimación del cambio esperado en el modelo. En esta encuesta de Aprendizaje Activo se ofrece un buen resumen de estas estrategias.

Aplicaciones reales

El aprendizaje activo es muy eficaz en campos especializados en los que la anotación de expertos es un cuello de botella.

  • Análisis de imágenes médicas: Cuando se entrena una IA para detectar enfermedades como el cáncer a partir de escáneres médicos, puede haber millones de imágenes disponibles, pero el tiempo de un radiólogo es limitado. En lugar de tener que etiquetar imágenes aleatorias, un sistema de aprendizaje activo puede señalar los casos más ambiguos o raros para su revisión. Esto concentra el esfuerzo del experto donde más se necesita, acelerando el desarrollo de un modelo muy preciso para tareas como la detección de tumores cerebrales. La investigación en este campo muestra reducciones significativas en el esfuerzo de etiquetado, como se detalla en estudios como éste sobre segmentación de imágenes biomédicas.
  • Conducción autónoma: Los sistemas de percepción de los vehículos autónomos deben entrenarse con conjuntos de datos amplios y diversos que abarquen innumerables escenarios de conducción. El aprendizaje activo puede identificar "casos extremos" a partir de los datos de conducción recopilados -como un peatón parcialmente oculto por un obstáculo o unas condiciones meteorológicas inusuales- con los que el modelo actual de detección de objetos tiene dificultades. Al dar prioridad a la anotación de estas escenas difíciles, los desarrolladores pueden mejorar de forma más eficaz la solidez y seguridad del modelo.

Aprendizaje activo frente a conceptos afines

Es importante distinguir el aprendizaje activo de otros paradigmas de aprendizaje que también utilizan datos no etiquetados:

  • Aprendizaje semisupervisado: Utiliza simultáneamente datos etiquetados y no etiquetados durante el entrenamiento. A diferencia del aprendizaje activo, normalmente utiliza todos los datos sin etiquetar disponibles de forma pasiva, en lugar de consultar de forma selectiva instancias específicas en busca de etiquetas.
  • Aprendizaje autosupervisado: Aprende representaciones a partir de datos no etiquetados creando tareas previas (por ejemplo, predecir una parte enmascarada de una imagen). No requiere anotación humana durante su fase de preentrenamiento, mientras que el aprendizaje activo depende de un oráculo para las etiquetas. DeepMind ha explorado ampliamente este campo.
  • Aprendizaje por refuerzo: Aprende por ensayo y error a través de interacciones con un entorno, recibiendo recompensas o penalizaciones por las acciones. No implica la búsqueda de etiquetas explícitas, como el aprendizaje activo.
  • Aprendizaje federado: Se centra en el entrenamiento de modelos a través de dispositivos descentralizados mientras se mantienen los datos locales, abordando principalmente las preocupaciones sobre la privacidad de los datos. El aprendizaje activo se centra en la adquisición eficiente de etiquetas. En ocasiones, estas técnicas pueden combinarse.

Herramientas y aplicación

La implementación del aprendizaje activo suele implicar la integración de modelos de ML con herramientas de anotación y la gestión del flujo de trabajo de datos. Frameworks como scikit-learn ofrecen algunas funcionalidades, mientras que existen bibliotecas especializadas para tareas específicas. El software de anotación, como Label Studio, puede integrarse en los procesos de aprendizaje activo, permitiendo a los anotadores proporcionar etiquetas para las muestras consultadas. La gestión eficaz de los conjuntos de datos en evolución y los modelos entrenados es crucial, y plataformas como Ultralytics HUB proporcionan infraestructura para organizar estos activos a lo largo del ciclo de vida de desarrollo. Explore el repositorio GitHub de Ultralytics para obtener más información sobre la aplicación de técnicas avanzadas de ML.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles