¡Domina la IA con el enriquecimiento rápido! Mejora los resultados de los Modelos de Grandes Lenguajes utilizando contexto, instrucciones claras y ejemplos para obtener resultados precisos.
El enriquecimiento de instrucciones es el proceso de mejorar automática o semiautomáticamente la instrucción de entrada inicial de un usuario antes de transmitirla a un modelo de Inteligencia Artificial (IA), en particular a los Grandes Modelos Lingüísticos (LLM). El objetivo es añadir contexto relevante, aclarar ambigüedades, imponer restricciones o incluir detalles específicos que ayuden a la IA a generar una respuesta más precisa, relevante y útil. Esta técnica mejora la calidad de la interacción entre los usuarios y los sistemas de IA haciendo que los avisos sean más eficaces sin necesidad de que el usuario sea un experto en ingeniería de avisos.
El proceso suele consistir en analizar la petición original y aprovechar fuentes de información adicionales o reglas predefinidas para aumentarla. Esto puede incluir acceder al historial del usuario, recuperar documentos relevantes de una base de conocimientos, incorporar el contexto de la conversación o aplicar instrucciones de formato específicas. Por ejemplo, una pregunta vaga como "Háblame de Ultralytics YOLO" podría enriquecerse con contexto que especifique que el usuario está interesado en la última versión(YOLOv11) o en su rendimiento comparado con otros modelos como YOLOv8. A menudo se emplean técnicas como la Generación Mejorada por Recuperación (RAG), en la que el sistema obtiene fragmentos de datos relevantes y los añade a la ventana de contexto de la pregunta.
El enriquecimiento rápido encuentra aplicaciones en diversas tareas impulsadas por la IA:
Es importante distinguir el enriquecimiento rápido de términos similares:
Aunque es menos común en las tareas tradicionales de visión por ordenador, como la detección estándar de objetos, el concepto es relevante para los nuevos modelos de visión con avisos, como YOLOE, que utilizan avisos de texto o imagen que podrían beneficiarse potencialmente del enriquecimiento contextual para mejorar el rendimiento sin disparos. Plataformas como Ultralytics HUB podrían incorporar potencialmente tales técnicas para simplificar la interacción del usuario al definir tareas de visión complejas.