Descubre cómo el Aprendizaje Semisupervisado combina datos etiquetados y no etiquetados para mejorar los modelos de IA, reducir los costes de etiquetado y aumentar la precisión.
El Aprendizaje Semisupervisado (SSL) es un tipo de técnica de Aprendizaje Automático (AM ) que se sitúa entre el aprendizaje supervisado y el aprendizaje no supervisado. Utiliza una combinación de una pequeña cantidad de datos etiquetados y una gran cantidad de datos sin etiquetar para entrenar modelos. La principal motivación del SSL es el elevado coste y esfuerzo que suele conllevar el etiquetado de datos, especialmente en dominios complejos. Al aprovechar los datos no etiquetados fácilmente disponibles, SSL pretende mejorar el rendimiento y la generalización del modelo más allá de lo que se podría conseguir utilizando sólo los limitados datos etiquetados.
El principio básico del Aprendizaje Semisupervisado es que los datos no etiquetados, a pesar de carecer de etiquetas explícitas, contienen información valiosa sobre la estructura y distribución subyacentes de los datos. Los algoritmos de SSL intentan explotar esta estructura para mejorar el proceso de aprendizaje. Los enfoques habituales suelen implicar hacer suposiciones sobre los datos, como la "suposición de conglomerado" (es probable que los puntos del mismo conglomerado tengan la misma etiqueta) o la "suposición de colector" (los puntos de datos se encuentran en un colector de dimensiones inferiores).
Las técnicas utilizadas en SSL incluyen métodos como el pseudoetiquetado, en el que un modelo entrenado en los datos etiquetados iniciales se utiliza para predecir las etiquetas de los datos no etiquetados. Las predicciones de alta confianza se tratan como "pseudoetiquetas" y se añaden al conjunto de entrenamiento. Otro enfoque consiste en la regularización de la consistencia, que anima al modelo a producir resultados similares para versiones perturbadas de la misma entrada no etiquetada, a menudo mediante técnicas como el aumento de datos. Estos métodos ayudan al modelo a aprender características más robustas utilizando el amplio conjunto de datos sin etiquetar. Puedes encontrar un buen resumen de SSL en Hacia la Ciencia de los Datos.
El aprendizaje semisupervisado es especialmente útil en escenarios en los que la obtención de datos etiquetados es un cuello de botella. Algunas áreas de aplicación clave son:
Es importante diferenciar el Aprendizaje Semisupervisado de los paradigmas de ML relacionados:
El aprendizaje semisupervisado ofrece un enfoque práctico y potente para crear sistemas eficaces de Inteligencia Artificial (IA), sobre todo en tareas de visión por ordenador como la detección de objetos, en las que abundan las imágenes o vídeos sin etiquetar. Plataformas como Ultralytics HUB facilitan la gestión de conjuntos de datos que pueden incluir mezclas de datos etiquetados y no etiquetados para el entrenamiento de modelos como Ultralytics YOLO. Explorar las técnicas SSL puede ser crucial para los proyectos que se enfrentan a limitaciones en la disponibilidad de datos etiquetados, como se destaca en recursos como las publicaciones sobre SSL del Blog deGoogle AI.