Glosario

Aprendizaje Semisupervisado

Libera el poder del aprendizaje semisupervisado para maximizar tanto los datos etiquetados como los no etiquetados, impulsando la eficiencia en las aplicaciones de IA. ¡Descubre cómo!

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El aprendizaje semisupervisado es un enfoque de aprendizaje automático que tiende un puente entre el aprendizaje supervisado y el no supervisado utilizando datos etiquetados y no etiquetados. Este método aprovecha la abundancia de datos no etiquetados, al tiempo que minimiza la necesidad de instancias etiquetadas, cuya obtención suele ser costosa y lenta.

Importancia y relevancia

En los escenarios típicos de aprendizaje automático, el aprendizaje supervisado se basa en gran medida en datos etiquetados, en los que cada entrada se empareja con una salida correcta. En cambio, el aprendizaje no supervisado no utiliza etiquetas. El aprendizaje semisupervisado logra un equilibrio utilizando una pequeña parte de datos etiquetados junto con un conjunto mayor de datos sin etiquetar. Este enfoque es especialmente beneficioso cuando etiquetar datos es caro o poco práctico, pero adquirir grandes cantidades de datos sin etiquetar es factible.

Explora más sobre las diferencias entre Aprendizaje Supervisado y Aprendizaje No Supervisado para comprender por qué es importante el aprendizaje semisupervisado.

Cómo funciona

Los modelos de aprendizaje semisupervisado suelen construirse entrenando inicialmente con un conjunto de datos etiquetados más pequeño. Una vez construido el modelo básico, se incorporan los datos no etiquetados para perfeccionar y mejorar aún más el modelo. A menudo se emplean técnicas como el autoentrenamiento, el coentrenamiento y los métodos basados en grafos:

  • Autoentrenamiento: El modelo predice etiquetas para los datos sin etiquetar, y estas predicciones se utilizan como si fueran etiquetas verdaderas en la siguiente ronda de entrenamiento.
  • Co-entrenamiento: Dos clasificadores se entrenan en perspectivas distintas de los datos, ayudándose mutuamente al etiquetar los datos no etiquetados.
  • Métodos basados en grafos: Las instancias de datos se representan como nodos en un grafo, y los algoritmos de aprendizaje semisupervisado propagan la información de la etiqueta a través de las aristas.

Aplicaciones en el mundo real

El aprendizaje semisupervisado se utiliza en diversos campos:

  • Sanidad: En la imagen médica, como la resonancia magnética o la tomografía computarizada, suele ser laborioso anotar todas las imágenes. Algunas imágenes son etiquetadas por expertos, y el modelo aprende tanto de las imágenes etiquetadas como de las no etiquetadas para reducir la carga de anotación. Más información sobre la IA en aplicaciones sanitarias.

  • Procesamiento del Lenguaje Natural (PLN): Al reducir la cantidad de datos de texto etiquetados manualmente, el aprendizaje semisupervisado puede ayudar en tareas como la clasificación de textos y el análisis de sentimientos. Descubre más sobre Aplicaciones del Procesamiento del Lenguaje Natural.

Diferencias clave con los conceptos afines

El aprendizaje semisupervisado no debe confundirse con conceptos similares como el aprendizaje activo y el aprendizaje por transferencia. El Aprendizaje Activo implica la selección de las muestras más informativas para etiquetarlas con el fin de mejorar la eficacia del aprendizaje. Mientras, el Aprendizaje por Transferencia implica transferir conocimientos de un dominio para mejorar el rendimiento en otro.

Retos y consideraciones

El aprendizaje semisupervisado se enfrenta a retos como garantizar la fiabilidad de las etiquetas predichas y manejar distribuciones de datos diversas. Esto requiere una selección cuidadosa de las técnicas algorítmicas y, a veces, una validación adicional para garantizar que los datos no etiquetados se utilizan eficazmente sin confundir el proceso de aprendizaje.

Conclusión

El aprendizaje semisupervisado es una poderosa herramienta de la IA que aprovecha la abundancia de datos no etiquetados para construir modelos predictivos más eficientes. Tiene aplicaciones en muchos sectores, desde la sanidad a la PNL, permitiendo modelos más sólidos con menos ejemplos etiquetados. Comprender y explorar este concepto puede conducir a soluciones innovadoras allí donde existan cuellos de botella en el etiquetado de datos. Explora cómo Ultralytics HUB puede ayudar en esfuerzos similares de IA y aprendizaje automático proporcionando una plataforma versátil para el entrenamiento y despliegue de modelos. Visita Ultralytics HUB para el entrenamiento y despliegue de modelos.

Leer todo