Domina a arte da engenharia de prontidão para orientar modelos de IA, como os LLMs, para obter resultados precisos e de alta qualidade em conteúdos, serviço ao cliente e muito mais.
A engenharia de prompts é a arte e a ciência de criar inputs eficazes (prompts) para orientar os modelos de Inteligência Artificial (IA), especialmente os Modelos de Linguagem Ampla (LLM), no sentido de gerar os resultados desejados. Envolve a compreensão da forma como estes modelos interpretam as instruções e a conceção iterativa de prompts que sejam claros, específicos e forneçam contexto suficiente para obter respostas exactas, relevantes e úteis. À medida que os modelos de IA se tornam mais integrados em várias ferramentas e fluxos de trabalho, é crucial dominar a engenharia de instruções para maximizar o seu potencial e garantir um desempenho fiável em tarefas que vão desde a simples resposta a perguntas até à complexa geração de textos criativos.
A engenharia de prontidão eficaz é frequentemente um processo iterativo. Começa por analisar os requisitos da tarefa e compreender as capacidades e limitações do modelo de IA pretendido. Em seguida, o engenheiro concebe uma mensagem inicial, testa-a, avalia o resultado e aperfeiçoa a mensagem com base nos resultados. Este aperfeiçoamento pode envolver a adição de instruções mais específicas, o fornecimento de exemplos(aprendizagem de poucos disparos), a definição do formato de saída desejado (por exemplo, JSON), a definição de restrições ou o ajuste do tom. As principais técnicas baseiam-se frequentemente em princípios do Processamento de Linguagem Natural (PNL) e requerem uma análise cuidadosa do impacto da redação no comportamento do modelo, influenciado pelos seus dados de formação e arquitetura, como o modelo Transformer descrito no famoso artigo "Attention Is All You Need".
São várias as estratégias habitualmente utilizadas na engenharia rápida:
Uma engenharia rápida é fundamental para o sucesso da implementação de muitas aplicações de IA:
Outras aplicações incluem motores de busca semânticos, ferramentas educativas interactivas e análises de dados sofisticadas através de interfaces de linguagem natural.
É útil distinguir a engenharia rápida de termos relacionados:
Embora distintas, estas técnicas podem ser complementares. Por exemplo, um prompt de base bem concebido pode ser automaticamente enriquecido com dados recuperados antes de ser processado por um modelo aperfeiçoado. Estruturas como a LangChain integram frequentemente estas diferentes abordagens.
Tradicionalmente menos proeminente na Visão por Computador (CV) em comparação com a PNL, a engenharia de prontidão está a tornar-se cada vez mais relevante com o surgimento de modelos multimodais e de sistemas de visão com prontidão. Modelos como o CLIP, o YOLO ou o YOLOE podem executar tarefas como a deteção de objectos ou a segmentação de imagens com base em descrições de texto. A criação de instruções de texto eficazes (por exemplo, "detecta todos os 'carros vermelhos' mas ignora os 'camiões'") é uma forma de engenharia de instruções crucial para orientar estes modelos de linguagem de visão. Plataformas como o Ultralytics HUB facilitam a interação com vários modelos, incluindo Ultralytics YOLO modelos como o YOLOv8 e YOLO11em que a definição de tarefas através de interfaces pode beneficiar de princípios de engenharia rápida, especialmente à medida que os modelos adquirem mais capacidades interactivas.