Glosario

Ingeniería rápida

Domina el arte de la ingeniería rápida para guiar modelos de IA como los LLM para obtener resultados precisos y de alta calidad en contenidos, atención al cliente y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La ingeniería de instrucciones es la práctica de diseñar, refinar y estructurar las entradas (instrucciones) que se dan a los modelos de Inteligencia Artificial (IA), en particular a los Modelos de Lenguaje Extenso (LLM) y otros sistemas de IA Generativa, para obtener los resultados deseados u óptimos. No se trata tanto de cambiar el modelo en sí como de comunicarse eficazmente con él mediante instrucciones, preguntas o ejemplos en lenguaje natural cuidadosamente elaborados. A medida que los modelos como el GPT-4 se vuelven más capaces, la calidad de la instrucción influye significativamente en la calidad, relevancia y utilidad de la respuesta generada.

El papel de los estímulos

Una indicación sirve como instrucción o consulta que guía el comportamiento del modelo de IA. Una ingeniería de instrucciones eficaz implica comprender cómo interpreta el modelo el lenguaje y probar iterativamente diferentes frases, contextos y restricciones. Este proceso suele requerir claridad, especificidad y proporcionar suficiente contexto o ejemplos dentro de la propia instrucción. Las técnicas van desde instrucciones sencillas a métodos más complejos, como proporcionar ejemplos(Aprendizaje de Pocos Tiros) o guiar el proceso de razonamiento del modelo(Estimulación de la Cadena de Pensamiento). El objetivo es salvar la distancia entre la intención humana y las capacidades de generación de resultados del modelo, que a menudo se exploran en campos como el Procesamiento del Lenguaje Natural (PLN).

Principales diferencias con otras técnicas

La Ingeniería Prompt difiere fundamentalmente de otras técnicas de optimización del Aprendizaje Automático (AM):

  • Ajuste fino: El ajuste fino consiste en volver a entrenar un modelo preentrenado en un conjunto de datos específico para adaptar los pesos internos del modelo a una tarea especializada. La ingeniería previa, por el contrario, trabaja con el modelo existente sin volver a entrenarlo, centrándose únicamente en la elaboración de la entrada.
  • Ajuste de hiperparámetros: Se trata de optimizar los parámetros que controlan el propio proceso de aprendizaje (como la velocidad de aprendizaje o el tamaño del lote) durante el entrenamiento del modelo. El ajuste de hiperparámetros se produce durante el tiempo de inferencia, optimizando la entrada al modelo ya entrenado. Puedes explorar las guías de ajuste de hiperparámetros para obtener más detalles sobre ese proceso.
  • Ingeniería de características: Normalmente utilizada en el ML tradicional, consiste en seleccionar, transformar o crear características a partir de datos brutos para mejorar el rendimiento del modelo. La ingeniería de características se ocupa de elaborar entradas de lenguaje natural para los modelos generativos, no de manipular características de datos tabulares.

Aplicaciones en el mundo real

Una ingeniería rápida es fundamental en varias aplicaciones de IA:

  1. Creación de contenidos: Los profesionales del marketing utilizan la ingeniería de avisos para generar tipos específicos de texto creativo, como esbozos de entradas de blog, variaciones de textos publicitarios o pies de foto de redes sociales, especificando el tono, el estilo, el público objetivo y las palabras clave. Por ejemplo, si se pide a un modelo "Escribe tres titulares atractivos para una campaña de marketing por correo electrónico dirigida a pequeños empresarios sobre la gestión del inventario con IA", se obtienen resultados más específicos que con un "Escribe titulares para correos electrónicos" genérico. Esto aprovecha las capacidades de generación de texto de los LLM.
  2. Chatbots de atención al cliente: Los desarrolladores diseñan instrucciones para definir la personalidad de un chatbot (por ejemplo, amistosa, formal), el alcance de sus conocimientos y los flujos de trabajo específicos para gestionar las consultas de los usuarios. Un mensaje podría indicar al bot: "Eres un útil agente de soporte de Ultralytics. Responde amablemente a las preguntas de los usuarios sobre las licencias del softwareYOLO Ultralytics . Si te preguntan por el precio, dirígeles a la página de precios". Esto garantiza interacciones coherentes y útiles, utilizando potencialmente técnicas como la Generación Mejorada por Recuperación (RAG) para acceder a información específica. Puedes obtener más información sobre cómo funcionan los LLM para comprender la tecnología subyacente.

Importancia y futuro

A medida que los modelos de IA se integran en sistemas más complejos, desde la generación de código a la investigación científica, la capacidad de guiarlos eficazmente a través de una ingeniería rápida se hace cada vez más vital. Requiere una mezcla de habilidad lingüística, conocimiento del dominio y comprensión de las capacidades y limitaciones del modelo de IA. Marcos como LangChain y recursos como la documentación de la API de OpenAI proporcionan herramientas y buenas prácticas para este campo en evolución. Garantizar un uso responsable también implica tener en cuenta la ética de la IA y mitigar los posibles sesgos de la IA mediante un cuidadoso diseño puntual. Explorar Ultralytics HUB puede aportar ideas sobre la gestión de los modelos y proyectos de IA en los que puedan surgir consideraciones sobre los avisos. Se sigue investigando para explorar estrategias de avisos más avanzadas, como la optimización automática de avisos y la comprensión de los matices de la interacción entre el ser humano y la IA.

Leer todo