Glossaire

Ingénierie rapide

Maîtrise l'art de l'ingénierie de la promptitude pour guider les modèles d'IA comme les LLM pour des sorties précises et de haute qualité dans le contenu, le service à la clientèle et plus encore.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'ingénierie des messages-guides est la pratique qui consiste à concevoir, affiner et structurer les entrées (messages-guides) données aux modèles d'intelligence artificielle (IA), en particulier les grands modèles de langage (LLM) et d'autres systèmes d'IA génératifs, afin d'obtenir les résultats souhaités ou optimaux. Il s'agit moins de modifier le modèle lui-même que de communiquer efficacement avec lui à l'aide d'instructions, de questions ou d'exemples soigneusement rédigés en langage naturel. Au fur et à mesure que les modèles comme le GPT-4 deviennent plus performants, la qualité de l'invite influence considérablement la qualité, la pertinence et l'utilité de la réponse générée.

Le rôle des messages-guides

Une invite est une instruction ou une requête qui guide le comportement du modèle d'IA. Pour que l'ingénierie de l'invite soit efficace, il faut comprendre comment un modèle interprète le langage et tester de façon itérative différentes formulations, contextes et contraintes. Ce processus exige souvent de la clarté, de la spécificité et la fourniture d'un contexte ou d'exemples suffisants dans l'invite elle-même. Les techniques vont des simples instructions à des méthodes plus complexes comme la fourniture d'exemples(Few-Shot Learning) ou l'orientation du processus de raisonnement du modèle(Chain-of-Thought Prompting). L'objectif est de combler le fossé entre l'intention humaine et les capacités de génération de résultats du modèle, qui sont souvent explorées dans des domaines tels que le traitement du langage naturel (NLP).

Principales différences par rapport aux autres techniques

Prompt Engineering diffère fondamentalement des autres techniques d'optimisation du Machine Learning (ML) :

  • Mise au point: Le réglage fin consiste à entraîner davantage un modèle pré-entraîné sur un ensemble de données spécifique afin d'adapter les poids de son modèle interne à une tâche spécialisée. L'ingénierie rapide, à l'inverse, travaille avec le modèle existant sans réentraînement, en se concentrant uniquement sur l'élaboration de l'entrée.
  • Réglage des hyperparamètres: Il s'agit d'optimiser les paramètres qui contrôlent le processus d'apprentissage lui-même (comme le taux d'apprentissage ou la taille du lot) pendant la formation du modèle. L'ingénierie rapide se produit pendant le temps d'inférence, en optimisant l'entrée du modèle déjà formé. Tu peux explorer les guides de réglage des hyperparamètres pour plus de détails sur ce processus.
  • Ingénierie des caractéristiques: Généralement utilisée dans la ML traditionnelle, elle consiste à sélectionner, transformer ou créer des caractéristiques à partir de données brutes afin d'améliorer les performances du modèle. L'ingénierie des prompts traite de l'élaboration d'entrées en langage naturel pour les modèles génératifs, et non de la manipulation de caractéristiques de données tabulaires.

Applications dans le monde réel

La rapidité de l'ingénierie est essentielle pour les différentes applications de l'IA :

  1. Création de contenu : Les spécialistes du marketing utilisent l'ingénierie d'incitation pour générer des types spécifiques de textes créatifs, tels que des ébauches d'articles de blog, des variantes de textes publicitaires ou des légendes de médias sociaux, en spécifiant le ton, le style, le public cible et les mots-clés. Par exemple, en demandant à un modèle "Rédige trois titres accrocheurs pour une campagne de marketing par courriel ciblant les propriétaires de petites entreprises à propos de la gestion des stocks alimentée par l'IA", on obtient des résultats plus ciblés qu'un générique "Rédige des titres de courriels." Cela permet d'exploiter les capacités de génération de texte des LLM.
  2. Chatbots d'assistance à la clientèle : Les développeurs conçoivent des messages-guides pour définir la personnalité d'un chatbot (par exemple, amicale, formelle), l'étendue de ses connaissances et les flux de travail spécifiques pour traiter les demandes des utilisateurs. Un message-guide peut indiquer au robot : "Tu es un agent d'assistance utile pour Ultralytics. Réponds poliment aux questions des utilisateurs sur les licences du logiciel Ultralytics YOLO . En cas de question sur les prix, dirige-les vers la page des prix." Cela permet de garantir des interactions cohérentes et utiles, en utilisant éventuellement des techniques telles que la génération améliorée par récupération (RAG) pour accéder à des informations spécifiques. Tu peux en savoir plus sur le fonctionnement des LLM pour comprendre la technologie sous-jacente.

Importance et avenir

À mesure que les modèles d'IA s'intègrent dans des systèmes plus complexes, de la génération de codes à la recherche scientifique, la capacité à les guider efficacement par le biais d'une ingénierie prompte devient de plus en plus vitale. Cela nécessite un mélange de compétences linguistiques, de connaissances du domaine et une compréhension des capacités et des limites du modèle d'IA. Des cadres comme LangChain et des ressources comme la documentation de l'API OpenAI fournissent des outils et des bonnes pratiques pour ce domaine en pleine évolution. Garantir une utilisation responsable implique également de prendre en compte l'éthique de l'IA et d'atténuer les biais potentiels de l'IA grâce à une conception prompte et minutieuse. L'exploration d'Ultralytics HUB peut donner un aperçu de la gestion des modèles d'IA et des projets où des considérations d'invite peuvent se présenter. D'autres recherches se poursuivent pour explorer des stratégies d'invite plus avancées, notamment l'optimisation automatique des invites et la compréhension des nuances de l'interaction entre l'homme et l'IA.

Tout lire