Glosario

Aprendizaje autosupervisado

Descubre el aprendizaje autosupervisado, un avance de la IA que aprovecha los datos no etiquetados para lograr avances rentables y escalables en visión, PNL y robótica.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El aprendizaje autosupervisado es un paradigma de aprendizaje automático que permite a los modelos aprender de grandes cantidades de datos sin etiquetar creando sus propias etiquetas mediante tareas previas. Este enfoque tiende un puente entre el aprendizaje supervisado, que se basa en datos etiquetados, y el aprendizaje no supervisado, que funciona con datos totalmente sin etiquetar. Al aprovechar el aprendizaje autosupervisado, los sistemas de IA pueden extraer patrones y representaciones significativos de los datos sin el costoso y largo proceso del etiquetado manual.

Cómo funciona el aprendizaje autosupervisado

En el aprendizaje autosupervisado, el modelo genera pseudoetiquetas a partir de los propios datos. Estas pseudoetiquetas se derivan de propiedades o transformaciones específicas de los datos. A continuación, el modelo se entrena para predecir estas etiquetas, fomentando la comprensión de la estructura subyacente de los datos. Entre las tareas de pretexto habituales se encuentran predecir las partes que faltan en una imagen, determinar si dos parches de imagen van juntos o predecir la siguiente palabra de una secuencia.

Por ejemplo:

  • En los datos de imagen, un modelo puede tener la tarea de predecir el ángulo de rotación aplicado a una imagen o reconstruir los píxeles que faltan.
  • En el procesamiento del lenguaje natural (PLN), podría predecir la siguiente palabra de una frase, como se ve en modelos como el GPT.

Relevancia en IA y ML

El aprendizaje autosupervisado es especialmente valioso porque la mayoría de los datos del mundo real no están etiquetados. Al permitir que los modelos aprendan de esta abundancia de datos no etiquetados, el aprendizaje autosupervisado mejora las aplicaciones en campos como la visión por ordenador, el procesamiento del lenguaje natural y la robótica. Este enfoque reduce la dependencia de los conjuntos de datos etiquetados, lo que lo hace rentable y escalable.

Conceptos relacionados

El aprendizaje autosupervisado es distinto de otros paradigmas de aprendizaje automático:

  • Aprendizaje supervisado: Requiere un conjunto de datos etiquetados para entrenar el modelo. Más información sobre el aprendizaje supervisado.
  • Aprendizaje no supervisado: Se centra en encontrar patrones en datos no etiquetados sin generar etiquetas. Explora el aprendizaje no supervisado.
  • Aprendizaje contrastivo: Una forma de aprendizaje autosupervisado que hace hincapié en distinguir entre puntos de datos similares y disímiles. Lee sobre el aprendizaje contrastivo.

Aplicaciones del aprendizaje autosupervisado

Reconocimiento de imágenes

El aprendizaje autosupervisado ha revolucionado el reconocimiento de imágenes al permitir que los modelos aprendan características a partir de conjuntos de datos no etiquetados. Por ejemplo, un modelo puede predecir la disposición espacial de los fragmentos de una imagen o reconstruir las partes que faltan de una imagen. Estas técnicas son fundamentales en aplicaciones como las imágenes médicas, donde los datos etiquetados suelen ser escasos. Más información sobre el reconocimiento de imágenes.

Procesamiento del Lenguaje Natural

En PNL, el aprendizaje autosupervisado potencia modelos como GPT y BERT. Estos sistemas predicen la siguiente palabra o palabras enmascaradas de una frase, lo que les permite destacar en tareas como la generación de textos, la traducción y el resumen. Infórmate sobre la GPT y sus aplicaciones en PNL.

Robótica

La robótica aprovecha el aprendizaje autosupervisado para interpretar entornos complejos y mejorar la toma de decisiones. Por ejemplo, un sistema robótico podría predecir las consecuencias de sus acciones basándose en la información visual, mejorando su capacidad para navegar o manipular objetos de forma autónoma.

Ejemplos reales

  1. Ultralytics HUB y Vision AI: Las técnicas autosupervisadas se emplean en plataformas como Ultralytics HUB para agilizar tareas como la detección de objetos y el entrenamiento de modelos. Al utilizar el aprendizaje autosupervisado, estos sistemas reducen la dependencia de conjuntos de datos etiquetados, facilitando el desarrollo escalable de la IA.
  2. Imágenes médicas: Los modelos de aprendizaje autosupervisado pueden analizar conjuntos de datos de resonancias magnéticas o tomografías computarizadas para detectar anomalías sin necesidad de un exhaustivo etiquetado manual por parte de los radiólogos. Más información sobre el papel de la IA en la mejora del diagnóstico en AI in Healthcare.

Ventajas del aprendizaje autosupervisado

  • Eficacia: Elimina la necesidad de extensos conjuntos de datos etiquetados, reduciendo costes.
  • Escalabilidad: Puede manejar conjuntos de datos no etiquetados a gran escala, lo que la hace adecuada para sectores como la sanidad y los vehículos autónomos.
  • Generalización: Produce representaciones robustas que generalizan bien en tareas posteriores, como la clasificación o la segmentación.

Retos y orientaciones futuras

A pesar de sus ventajas, el aprendizaje autosupervisado conlleva retos:

  • Complejidad de las tareas de pretexto: Diseñar tareas pretexto adecuadas para distintos tipos de datos puede ser todo un reto.
  • Costes computacionales: Los modelos autosupervisados suelen requerir importantes recursos informáticos para su entrenamiento.

A medida que avanza la investigación en IA, el aprendizaje autosupervisado sigue evolucionando, ampliando su impacto en todos los sectores. Explora sus posibles aplicaciones en vehículos autónomos o fabricación.

El aprendizaje autosupervisado representa un importante salto adelante en la maximización de la utilidad de los datos no etiquetados. Al transformar la forma en que los sistemas de IA aprenden y se adaptan, abre nuevos horizontes para la innovación y la eficacia en el aprendizaje automático.

Leer todo