Glosario

Prompt Enriquecimiento

¡Domina la IA con el enriquecimiento rápido! Mejora los resultados de los Modelos de Grandes Lenguajes utilizando contexto, instrucciones claras y ejemplos para obtener resultados precisos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El enriquecimiento de peticiones es el proceso de mejorar automática o semiautomáticamente la petición de entrada inicial de un usuario antes de que la procese un modelo de Inteligencia Artificial (IA), especialmente los Grandes Modelos Lingüísticos (LLM). El objetivo principal es mejorar la calidad, la relevancia y la especificidad del resultado de la IA añadiendo información contextual relevante, aclarando posibles ambigüedades, estableciendo restricciones o incluyendo detalles específicos. Esta técnica perfecciona la interacción entre los usuarios y los sistemas de IA, haciendo que los avisos sean más eficaces sin necesidad de que el usuario tenga profundos conocimientos de ingeniería de avisos, mejorando así la experiencia general del usuario (UX).

Cómo funciona el enriquecimiento rápido

El proceso de enriquecimiento suele comenzar analizando la petición original del usuario. Basándose en este análisis, el sistema aprovecha fuentes de información adicionales o reglas predefinidas para aumentar la petición. Esto puede implicar acceder al historial de interacciones del usuario, recuperar documentos pertinentes de una base de conocimientos, incorporar el contexto de la conversación en curso o aplicar instrucciones de formato específicas requeridas por el modelo. Por ejemplo, una pregunta sencilla como "Resuma los últimos avances Ultralytics Ultralytics " podría enriquecerse para especificar "Resuma las características clave y las mejoras de rendimiento de Ultralytics YOLOv11 en comparación con YOLOv8centrándose en las tareas de detección de objetos ". Se suelen utilizar técnicas como la Generación Mejorada por Recuperación (RAG), en la que el sistema recupera fragmentos de datos relevantes (por ejemplo, de Ultralytics Docs) y los incorpora a la ventana contextual de la solicitud antes de enviarla al LLM. Esto garantiza que el modelo dispone de los antecedentes necesarios para generar una respuesta completa y precisa.

Aplicaciones y ejemplos

El enriquecimiento de instrucciones es valioso en numerosas aplicaciones basadas en IA, ya que mejora la calidad de la interacción y el rendimiento de las tareas:

  • Chatbots de atención al cliente: Un cliente que pregunte "¿Cuál es el estado de mi pedido?" puede enriquecer su consulta con su ID de usuario o número de pedido reciente recuperado de un sistema de Gestión de Relaciones con el Cliente (CRM ) mediante la integración API. El mensaje enriquecido permite al chatbot proporcionar una actualización específica inmediatamente, en lugar de hacer preguntas aclaratorias de seguimiento.
  • Asistentes virtuales para la personalización: Cuando un usuario pide a un asistente virtual como Google Assistant o Alexa "Pon música", la indicación puede enriquecerse en función del historial de escucha del usuario, sus géneros preferidos, la hora del día o incluso la actividad actual detectada a través de dispositivos conectados, lo que conduce a una selección musical más personalizada.
  • Herramientas de creación de contenidos: Un asistente de escritura creativa que utilice la generación de texto podría recibir una indicación vaga como "Escribe una historia". El enriquecimiento de la instrucción podría añadir detalles basados en interacciones anteriores, como "Escribe una historia corta de ciencia ficción ambientada en un futuro distópico, con un protagonista rebelde", haciendo que el resultado se ajuste más a los intereses probables del usuario.
  • Sistemas debúsqueda semántica: Al buscar documentos internos de la empresa, una consulta como "Buscar informes sobre el rendimiento del 4º trimestre" puede enriquecerse con el departamento, la función y los permisos de acceso del usuario para recuperar los documentos más relevantes y permitidos de un vasto lago de datos.

Enriquecer el Prompt vs. Conceptos relacionados

Comprender los matices entre el enriquecimiento rápido y otros términos similares es crucial:

  • Ingeniería de instrucciones: Suele ser un proceso manual en el que los humanos elaboran cuidadosamente las instrucciones para obtener las respuestas deseadas de una IA. El enriquecimiento de instrucciones, por el contrario, pretende automatizar o semiautomatizar este proceso de mejora, a menudo partiendo de una instrucción de usuario inicial menos refinada.
  • Ajuste de estímulos: Esta técnica consiste en aprender incrustaciones suaves de avisos mediante el descenso gradiente para condicionar un modelo preentrenado congelado para tareas específicas. Modifica partes de la representación de entrada del modelo en lugar de la propia indicación textual. Es una forma de ajuste fino eficaz de los parámetros (PEFT).
  • Ajuste fino: Consiste en actualizar los pesos de un modelo preentrenado en un conjunto de datos más pequeño y específico de la tarea. El enriquecimiento de las instrucciones no cambia los parámetros del modelo, sólo modifica las instrucciones de entrada que se introducen en el modelo existente.
  • Generación Mejorada por Recuperación (GAR): La RAG es un método específico que se emplea a menudo en los sistemas de enriquecimiento de instrucciones. Se centra en recuperar datos externos relevantes y añadirlos al contexto del estímulo para mejorar la base factual y reducir las alucinaciones.

Relevancia en la visión por ordenador

Aunque el enriquecimiento rápido se asocia más comúnmente con los LLM y la Comprensión del Lenguaje Natural (NLU), sus principios están adquiriendo relevancia en la Visión por Ordenador (CV). Las tareas tradicionales de CV, como la detección de objetos estándar mediante modelos como Ultralytics YOLO suelen basarse en entradas de imágenes en lugar de en complejas indicaciones de texto. Sin embargo, los nuevos modelos multimodales y los sistemas de visión guiables, como CLIP, YOLO y YOLOE, aceptan indicaciones de texto o imagen para guiar tareas como la detección de disparo cero. Para estos modelos, enriquecer una simple indicación de texto (por ejemplo, "detecta vehículos") con más contexto (por ejemplo, "detecta sólo vehículos de emergencia como ambulancias y camiones de bomberos en esta imagen de cámara de tráfico") podría mejorar significativamente el rendimiento y la especificidad. Plataformas como Ultralytics HUB podrían integrar potencialmente estas técnicas para simplificar la interacción del usuario al definir tareas de visión complejas o analizar resultados, lo que representa un área de investigación y desarrollo de la IA en curso destinada a mejorar la seguridad y usabilidad de la IA en todos los dominios.

Leer todo