¡Domina la IA con el enriquecimiento rápido! Mejora los resultados de los Modelos de Grandes Lenguajes utilizando contexto, instrucciones claras y ejemplos para obtener resultados precisos.
El enriquecimiento de peticiones es el proceso de mejorar automática o semiautomáticamente la petición de entrada inicial de un usuario antes de que la procese un modelo de Inteligencia Artificial (IA), especialmente los Grandes Modelos Lingüísticos (LLM). El objetivo principal es mejorar la calidad, la relevancia y la especificidad del resultado de la IA añadiendo información contextual relevante, aclarando posibles ambigüedades, estableciendo restricciones o incluyendo detalles específicos. Esta técnica perfecciona la interacción entre los usuarios y los sistemas de IA, haciendo que los avisos sean más eficaces sin necesidad de que el usuario tenga profundos conocimientos de ingeniería de avisos, mejorando así la experiencia general del usuario (UX).
El proceso de enriquecimiento suele comenzar analizando la petición original del usuario. Basándose en este análisis, el sistema aprovecha fuentes de información adicionales o reglas predefinidas para aumentar la petición. Esto puede implicar acceder al historial de interacciones del usuario, recuperar documentos pertinentes de una base de conocimientos, incorporar el contexto de la conversación en curso o aplicar instrucciones de formato específicas requeridas por el modelo. Por ejemplo, una pregunta sencilla como "Resuma los últimos avances Ultralytics Ultralytics " podría enriquecerse para especificar "Resuma las características clave y las mejoras de rendimiento de Ultralytics YOLOv11 en comparación con YOLOv8centrándose en las tareas de detección de objetos ". Se suelen utilizar técnicas como la Generación Mejorada por Recuperación (RAG), en la que el sistema recupera fragmentos de datos relevantes (por ejemplo, de Ultralytics Docs) y los incorpora a la ventana contextual de la solicitud antes de enviarla al LLM. Esto garantiza que el modelo dispone de los antecedentes necesarios para generar una respuesta completa y precisa.
El enriquecimiento de instrucciones es valioso en numerosas aplicaciones basadas en IA, ya que mejora la calidad de la interacción y el rendimiento de las tareas:
Comprender los matices entre el enriquecimiento rápido y otros términos similares es crucial:
Aunque el enriquecimiento rápido se asocia más comúnmente con los LLM y la Comprensión del Lenguaje Natural (NLU), sus principios están adquiriendo relevancia en la Visión por Ordenador (CV). Las tareas tradicionales de CV, como la detección de objetos estándar mediante modelos como Ultralytics YOLO suelen basarse en entradas de imágenes en lugar de en complejas indicaciones de texto. Sin embargo, los nuevos modelos multimodales y los sistemas de visión guiables, como CLIP, YOLO y YOLOE, aceptan indicaciones de texto o imagen para guiar tareas como la detección de disparo cero. Para estos modelos, enriquecer una simple indicación de texto (por ejemplo, "detecta vehículos") con más contexto (por ejemplo, "detecta sólo vehículos de emergencia como ambulancias y camiones de bomberos en esta imagen de cámara de tráfico") podría mejorar significativamente el rendimiento y la especificidad. Plataformas como Ultralytics HUB podrían integrar potencialmente estas técnicas para simplificar la interacción del usuario al definir tareas de visión complejas o analizar resultados, lo que representa un área de investigación y desarrollo de la IA en curso destinada a mejorar la seguridad y usabilidad de la IA en todos los dominios.