Cheque verde
Enlace copiado en el portapapeles

Comprender el aprendizaje de pocos disparos, cero disparos y transferencia

Explora las diferencias entre el aprendizaje de pocos disparos, el aprendizaje de cero disparos y el aprendizaje por transferencia en visión por ordenador, y cómo estos paradigmas configuran el entrenamiento de modelos de IA.

Los sistemas de inteligencia artificial (IA) pueden realizar tareas complejas como reconocer caras, clasificar imágenes y conducir coches con una intervención humana mínima. Lo hacen estudiando datos, reconociendo patrones y utilizándolos para hacer predicciones o tomar decisiones. A medida que avanza la IA, somos testigos de formas cada vez más sofisticadas en que los modelos de IA pueden aprender, adaptarse y realizar tareas con notable eficacia.

Por ejemplo, la visión por ordenador es una rama de la IA que se centra en capacitar a las máquinas para interpretar y comprender la información visual del mundo. El desarrollo tradicional de modelos de visión por ordenador depende en gran medida de grandes conjuntos de datos anotados para el entrenamiento. Recopilar y etiquetar estos datos puede llevar mucho tiempo y ser costoso. 

Para hacer frente a estos retos, los investigadores han introducido enfoques innovadores como el aprendizaje de pocos disparos (FSL), que aprende a partir de ejemplos limitados; el aprendizaje de disparo cero (ZSL), que identifica objetos no vistos; y el aprendizaje por transferencia (TL), que aplica el conocimiento de modelos preentrenados a nuevas tareas.

En este artículo, exploraremos cómo funcionan estos paradigmas de aprendizaje, destacaremos sus principales diferencias y veremos aplicaciones en el mundo real. ¡Empecemos ya!

Una visión general de los paradigmas de aprendizaje

Exploremos qué son el aprendizaje de pocos disparos, el aprendizaje de cero disparos y el aprendizaje por transferencia con respecto a la visión por ordenador y cómo funcionan. 

Aprendizaje con pocos disparos

El aprendizaje con pocos ejemplos es un método en el que los sistemas aprenden a reconocer nuevos objetos utilizando sólo un pequeño número de ejemplos. Por ejemplo, si muestras a un modelo unas cuantas fotos de un pingüino, un pelícano y un frailecillo (este pequeño grupo se denomina "conjunto de apoyo"), aprende cómo son estas aves. 

Más tarde, si muestras al modelo una nueva imagen, como un pingüino, compara esta nueva imagen con las de su conjunto de apoyo y elige la más parecida. Cuando es difícil reunir una gran cantidad de datos, este método es beneficioso porque el sistema puede seguir aprendiendo y adaptándose con sólo unos pocos ejemplos.

Fig. 1. Una visión general de cómo funciona el aprendizaje de pocos disparos.

Aprendizaje sin disparos

El aprendizaje cero es una forma de que las máquinas reconozcan cosas que nunca han visto antes sin necesitar ejemplos de ellas. Utiliza información semántica, como descripciones, para ayudar a establecer conexiones.

Por ejemplo, si una máquina ha aprendido sobre animales como gatos, leones y caballos comprendiendo características como "pequeño y esponjoso", "gran gato salvaje" o "cara larga", puede utilizar este conocimiento para identificar un animal nuevo, como un tigre. Aunque no haya visto nunca un tigre, puede utilizar una descripción como "un animal parecido a un león con rayas oscuras" para identificarlo correctamente. Esto facilita que las máquinas aprendan y se adapten sin necesidad de muchos ejemplos.

Fig. 2. El aprendizaje por disparo cero identifica nuevos objetos mediante descripciones.

Aprendizaje por transferencia

El aprendizaje por transferencia es un paradigma de aprendizaje en el que un modelo utiliza lo aprendido en una tarea para ayudar a resolver una tarea nueva similar. Esta técnica es especialmente útil en tareas de visión por ordenador como la detección de objetos, la clasificación de imágenes y el reconocimiento de patrones. 

Por ejemplo, en visión por ordenador, un modelo preentrenado puede reconocer objetos generales, como animales, y luego afinarse mediante aprendizaje por transferencia para identificar otros específicos, como diferentes razas de perros. Al reutilizar los conocimientos de tareas anteriores, el aprendizaje por transferencia facilita el entrenamiento de modelos de visión por ordenador en conjuntos de datos más pequeños, ahorrando tiempo y esfuerzo.

Fig. 3. Visión general del funcionamiento del aprendizaje por transferencia.

Quizá te preguntes qué tipo de modelos admiten el aprendizaje por transferencia. Ultralytics YOLO11 es un gran ejemplo de modelo de visión por ordenador que puede hacerlo. Se trata de un modelo de detección de objetos de última generación que primero se preentrena en un gran conjunto de datos generales. Después, se puede ajustar y entrenar a medida en un conjunto de datos más pequeño y especializado para tareas específicas.

Comparar paradigmas de aprendizaje

Ahora que hemos hablado del aprendizaje de pocos disparos, del aprendizaje de cero disparos y del aprendizaje por transferencia, vamos a compararlos para ver en qué se diferencian.

Fig. 4. Diferencias clave entre aprendizaje de pocos disparos, cero disparos y transferencia Imagen del autor.

El aprendizaje de pocos ejemplos es útil cuando sólo tienes una pequeña cantidad de datos etiquetados. Permite que un modelo de IA aprenda a partir de unos pocos ejemplos. En cambio, el aprendizaje de cero disparos no requiere datos etiquetados. En su lugar, utiliza descripciones o contexto para ayudar al sistema a manejar nuevas tareas. Mientras tanto, el aprendizaje por transferencia adopta un enfoque diferente al utilizar conocimientos de modelos preentrenados, lo que les permite adaptarse rápidamente a nuevas tareas con un mínimo de datos adicionales. Cada método tiene sus propios puntos fuertes, dependiendo del tipo de datos y de la tarea en la que estés trabajando.

Aplicaciones reales de diversos paradigmas de aprendizaje

Estos paradigmas de aprendizaje ya están marcando la diferencia en muchos sectores, resolviendo problemas complejos con soluciones innovadoras. Veamos más de cerca cómo pueden aplicarse en el mundo real.

Diagnosticar enfermedades raras con aprendizaje de pocos disparos

El aprendizaje de pocos datos es un cambio de juego para el sector sanitario, especialmente en la imagen médica. Puede ayudar a los médicos a diagnosticar enfermedades raras utilizando sólo unos pocos ejemplos o incluso descripciones, sin necesidad de grandes cantidades de datos. Esto es especialmente útil cuando los datos son limitados, lo que suele ocurrir porque recopilar grandes conjuntos de datos para enfermedades raras puede ser todo un reto.

Por ejemplo, SHEPHERD utiliza el aprendizaje de pocos datos y los grafos de conocimiento biomédico para diagnosticar trastornos genéticos raros. Mapea la información del paciente, como síntomas y resultados de pruebas, en una red de genes y enfermedades conocidos. Esto ayuda a determinar la causa genética probable y a encontrar casos similares, incluso cuando los datos son limitados. 

Fig. 5. El modelo Shepherd diagnostica enfermedades raras utilizando datos mínimos.

Mejora de la detección de enfermedades de las plantas con aprendizaje de disparo cero

En la agricultura, es esencial identificar rápidamente las enfermedades de las plantas, porque los retrasos en la detección pueden provocar daños generalizados en las cosechas, una reducción de los rendimientos e importantes pérdidas económicas. Los métodos tradicionales suelen basarse en grandes conjuntos de datos y conocimientos de expertos, que no siempre son accesibles, especialmente en zonas remotas o de recursos limitados. Aquí es donde entran en juego los avances en IA, como el aprendizaje por disparo cero.

Supongamos que un agricultor cultiva tomates y patatas y observa síntomas como hojas amarillentas o manchas marrones. El aprendizaje de disparo cero puede ayudar a identificar enfermedades como el tizón tardío sin necesidad de grandes conjuntos de datos. Utilizando descripciones de los síntomas, el modelo puede clasificar enfermedades que no ha visto antes. Este enfoque es rápido, escalable y permite a los agricultores detectar diversos problemas de las plantas. Les ayuda a controlar la salud de los cultivos de forma más eficaz, tomar medidas a tiempo y reducir las pérdidas.

Fig. 6. Utilización del aprendizaje de tiro cero para identificar enfermedades de las plantas.

Vehículos autónomos y aprendizaje por transferencia

Los vehículos autónomos a menudo necesitan adaptarse a entornos diferentes para navegar con seguridad. El aprendizaje por transferencia les ayuda a utilizar los conocimientos previos para adaptarse rápidamente a las nuevas condiciones sin empezar su entrenamiento desde cero. Combinadas con la visión por ordenador, que ayuda a los vehículos a interpretar la información visual, estas tecnologías permiten una navegación más fluida por diferentes terrenos y condiciones meteorológicas, haciendo que la conducción autónoma sea más eficiente y fiable.

Un buen ejemplo de esto en acción es un sistema de gestión de aparcamientos que utilizaYOLO11 Ultralytics para controlar las plazas de aparcamiento. YOLO11, un modelo de detección de objetos preentrenado, puede ajustarse mediante aprendizaje por transferencia para identificar plazas de aparcamiento vacías y ocupadas en tiempo real. Al entrenar el modelo con un conjunto de datos más pequeño de imágenes de aparcamientos, aprende a detectar con precisión plazas abiertas, plazas llenas e incluso zonas reservadas.

Fig. 7. Gestión de aparcamientos mediante Ultralytics YOLO11.

Integrado con otras tecnologías, este sistema puede guiar a los conductores al lugar disponible más cercano, ayudando a reducir el tiempo de búsqueda y la congestión del tráfico. El aprendizaje por transferencia lo hace posible basándose en las capacidades existentes de detección de objetos de YOLO11, lo que le permite adaptarse a las necesidades específicas de la gestión de aparcamientos sin empezar de cero. Este enfoque ahorra tiempo y recursos a la vez que crea una solución altamente eficiente y escalable que mejora las operaciones de aparcamiento y mejora la experiencia general del usuario.

Tendencias emergentes en los paradigmas de aprendizaje

El futuro de los paradigmas de aprendizaje en visión por ordenador se inclina hacia el desarrollo de sistemas de IA de Visión más inteligentes y sostenibles. En concreto, una tendencia creciente es el uso de enfoques híbridos que combinan el aprendizaje de pocos disparos, el aprendizaje de cero disparos y el aprendizaje por transferencia. Combinando los puntos fuertes de estos métodos, los modelos pueden aprender nuevas tareas con un mínimo de datos y aplicar sus conocimientos en distintas áreas.

Un ejemplo interesante es el uso de incrustaciones profundas adaptadas para afinar los modelos utilizando conocimientos de tareas anteriores y una pequeña cantidad de datos nuevos, lo que facilita el trabajo con conjuntos de datos limitados. 

Del mismo modo, el aprendizaje X-shot está diseñado para manejar tareas con diferentes cantidades de datos. Utiliza una supervisión débil, en la que los modelos aprenden a partir de etiquetas limitadas o ruidosas, e instrucciones claras para ayudarles a adaptarse rápidamente, incluso con pocos o ningún ejemplo previo disponible. Estos enfoques híbridos muestran cómo la integración de distintos métodos de aprendizaje puede ayudar a los sistemas de IA a afrontar los retos con mayor eficacia.

Puntos clave

El aprendizaje de pocos disparos, el aprendizaje de cero disparos y el aprendizaje por transferencia abordan cada uno retos específicos de la visión por ordenador, por lo que son adecuados para tareas diferentes. El enfoque adecuado depende de la aplicación concreta y de la cantidad de datos disponibles. Por ejemplo, el aprendizaje de pocos disparos funciona bien con datos limitados, mientras que el aprendizaje de disparo cero es estupendo para tratar con clases no vistas o desconocidas.

De cara al futuro, es probable que la combinación de estos métodos para crear modelos híbridos que integren visión, lenguaje y audio sea un objetivo clave. Estos avances pretenden hacer que los sistemas de IA sean más flexibles, eficaces y capaces de abordar problemas complejos, abriendo nuevas posibilidades de innovación en este campo.

Explora más sobre la IA uniéndote a nuestra comunidad y consultando nuestro repositorio de GitHub. Aprende cómo la IA en los coches autoconducidos y la visión por ordenador en la agricultura están remodelando el futuro. ¡Echa un vistazo a las opciones disponibles de la licenciaYOLO para empezar!

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático