Glosario

Aprendizaje de tiro cero

Descubre el Aprendizaje Cero Disparos: un enfoque de IA de vanguardia que permite a los modelos clasificar datos invisibles, revolucionando la detección de objetos, la PNL y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Aprendizaje Cero Disparos (ZSL) representa un área fascinante dentro del Aprendizaje Automático (AM) en la que se entrena un modelo para reconocer y clasificar categorías de datos que nunca ha visto explícitamente durante la fase de entrenamiento. A diferencia de los enfoques tradicionales de aprendizaje supervisado, que requieren ejemplos etiquetados para cada categoría posible, el ZSL pretende generalizar el conocimiento de clases vistas a clases no vistas utilizando información auxiliar compartida. Esta capacidad es especialmente valiosa en situaciones reales en las que adquirir datos etiquetados para cada categoría concebible es poco práctico o imposible.

Cómo funciona el Aprendizaje Cero Tiros

La idea central de la ZSL es aprender una correspondencia entre el espacio de características de entrada (por ejemplo, características de imagen o características de texto) y un espacio de incrustación semántica. Este espacio semántico suele codificar propiedades descriptivas de alto nivel o atributos compartidos entre clases vistas y no vistas. Por ejemplo, en visión por ordenador, pueden ser atributos visuales como "tiene rayas", "tiene pelo", "tiene alas", o descripciones basadas en texto. En el Procesamiento del Lenguaje Natural (PLN), las incrustaciones de palabras suelen servir como este espacio semántico.

Durante el entrenamiento, el modelo aprende a asociar las características de las clases vistas con sus correspondientes representaciones semánticas (por ejemplo, atributos o incrustaciones). En el momento de la inferencia, cuando se le presenta una instancia de una clase no vista, el modelo extrae sus características y las mapea en el espacio semántico aprendido. Al comparar este mapeo con las representaciones semánticas conocidas de las clases no vistas (proporcionadas por separado), el modelo puede predecir la etiqueta de la clase incluso sin ejemplos previos. Los modelos de Aprendizaje Profundo, en particular los que utilizan técnicas de aprendizaje contrastivo como CLIP, se emplean a menudo para tareas de ZSL debido a su capacidad para aprender representaciones ricas en características. Puedes explorar varios conjuntos de datos adecuados para tales tareas, como los que se enumeran en la documentación de Conjuntos de datosUltralytics .

Aplicaciones en el mundo real

Zero-Shot Learning permite potentes aplicaciones en varios dominios:

  1. Reconocimiento de Objetos Novedosos: En la clasificación de imágenes o la detección de objetos, la ZSL permite a los sistemas identificar objetos no presentes en los datos de entrenamiento iniciales. Por ejemplo, un sistema de vigilancia de la vida salvaje entrenado en animales comunes podría identificar potencialmente una especie rara o recién descubierta basándose en una descripción textual o en un conjunto de atributos semánticos proporcionados por expertos. Modelos como Ultralytics YOLO aprovechan esta capacidad para la detección de vocabulario abierto.
  2. Categorización dinámica de contenidos: ZSL puede categorizar documentos, artículos de noticias o contenidos generados por usuarios en temas emergentes para los que no existen datos etiquetados previos. Un sistema podría entrenarse en categorías existentes y luego utilizar incrustaciones de palabras o descripciones de temas para clasificar contenidos relacionados con acontecimientos o tendencias imprevistos.

ZSL frente a paradigmas de aprendizaje relacionados

Es importante distinguir la ZSL de los conceptos relacionados:

  • Aprendizaje de pocos ejemplos: Pretende aprender nuevas clases a partir de un número muy pequeño de ejemplos etiquetados (más de cero).
  • Aprendizaje de una sola vez: Un caso específico de aprendizaje de pocos disparos en el que sólo se dispone de un ejemplo etiquetado para cada nueva clase.
  • Aprendizaje por transferencia: Consiste en aprovechar los conocimientos adquiridos en una tarea o dominio para mejorar el rendimiento en una tarea o dominio diferente pero relacionado. A menudo implica afinar un modelo preentrenado en datos de destino, que suelen incluir ejemplos de las clases de destino.

El diferenciador clave es que el ZSL funciona bajo la estricta condición de tener cero ejemplos etiquetados para las clases objetivo durante el entrenamiento o la adaptación. Para una visión comparativa, consulta la discusión sobre Comprender el Aprendizaje de Pocos Ejemplos, el Aprendizaje de Cero Ejemplos y el Aprendizaje por Transferencia.

Importancia en la IA

El Aprendizaje Cero Disparos mejora significativamente la escalabilidad y adaptabilidad de los sistemas de IA. Reduce la dependencia de la recopilación y anotación exhaustivas de datos, que suele ser un cuello de botella en el desarrollo de aplicaciones de ML a gran escala. Al permitir que los modelos razonen sobre conceptos desconocidos, la ZSL amplía los límites de la generalización en la Inteligencia Artificial (IA), haciendo que los sistemas sean más robustos y capaces de manejar la naturaleza abierta del mundo real. Plataformas como Ultralytics HUB facilitan la formación y el despliegue de modelos, incluidos los que podrían aprovechar los principios ZSL en el futuro. Para más detalles sobre la investigación ZSL, consulta recursos como la página ZSL de Wikipedia o los estudios académicos que se encuentran en plataformas como arXiv.

Leer todo