Glossário

Engenharia rápida

Domina a arte da engenharia de prontidão para orientar modelos de IA, como os LLMs, para obter resultados precisos e de alta qualidade em conteúdos, serviço ao cliente e muito mais.

A engenharia de prompts é a arte e a ciência de criar inputs eficazes (prompts) para orientar os modelos de Inteligência Artificial (IA), especialmente os Modelos de Linguagem Ampla (LLM), no sentido de gerar os resultados desejados. Envolve a compreensão da forma como estes modelos interpretam as instruções e a conceção iterativa de prompts que sejam claros, específicos e forneçam contexto suficiente para obter respostas exactas, relevantes e úteis. À medida que os modelos de IA se tornam mais integrados em várias ferramentas e fluxos de trabalho, é crucial dominar a engenharia de instruções para maximizar o seu potencial e garantir um desempenho fiável em tarefas que vão desde a simples resposta a perguntas até à complexa geração de textos criativos.

Como funciona o Prompt Engineering

A engenharia de prontidão eficaz é frequentemente um processo iterativo. Começa por analisar os requisitos da tarefa e compreender as capacidades e limitações do modelo de IA pretendido. Em seguida, o engenheiro concebe uma mensagem inicial, testa-a, avalia o resultado e aperfeiçoa a mensagem com base nos resultados. Este aperfeiçoamento pode envolver a adição de instruções mais específicas, o fornecimento de exemplos(aprendizagem de poucos disparos), a definição do formato de saída desejado (por exemplo, JSON), a definição de restrições ou o ajuste do tom. As principais técnicas baseiam-se frequentemente em princípios do Processamento de Linguagem Natural (PNL) e requerem uma análise cuidadosa do impacto da redação no comportamento do modelo, influenciado pelos seus dados de formação e arquitetura, como o modelo Transformer descrito no famoso artigo "Attention Is All You Need".

Técnicas de estímulo chave

São várias as estratégias habitualmente utilizadas na engenharia rápida:

Solicitação Zero-Shot: Pede diretamente ao modelo para executar uma tarefa sem fornecer exemplos prévios dentro do próprio prompt. Isto baseia-se no conhecimento pré-existente do modelo adquirido durante o treino. Ver Aprendizagem Zero-Shot.
Prompting de poucos exemplos: Inclui um pequeno número de exemplos (pares de entrada-saída) diretamente no prompt para guiar o modelo na tarefa e no formato desejados.
Encorajamento da Cadeia de Pensamento (CoT): Encorajar o modelo a "pensar passo a passo", pedindo-lhe que decomponha o seu processo de raciocínio antes de dar a resposta final, melhorando frequentemente o desempenho em tarefas complexas.
Solicitação de papel: Instruir o modelo a adotar uma persona ou papel específico (por exemplo, "Age como um programador Python especialista") para adaptar o seu estilo de resposta e conteúdo.
Especifica a estrutura de saída: Define claramente o formato desejado para a saída, como solicitar uma lista numerada, uma tabela ou um código formatado em uma linguagem específica. Recursos como o Guia de engenharia de prompts da OpenAI oferecem práticas recomendadas.

Aplicações no mundo real

Uma engenharia rápida é fundamental para o sucesso da implementação de muitas aplicações de IA:

Automatização do serviço ao cliente: Concebe avisos para chatbots e assistentes virtuais para tratar as questões dos clientes com precisão, manter uma voz específica da marca e escalar problemas complexos de forma adequada. As empresas utilizam estas técnicas para melhorar a experiência do cliente, como se vê em plataformas como a Zendesk AI.
Criação e resumo de conteúdos: Criar prompts para ferramentas de IA generativa (como as desenvolvidas por Cohere ou Anthropic) para gerar textos de marketing, escrever e-mails, resumir documentos longos(resumo de texto) ou até mesmo gerar trechos de código usando ferramentas como o GitHub Copilot.

Outras aplicações incluem motores de busca semânticos, ferramentas educativas interactivas e análises de dados sofisticadas através de interfaces de linguagem natural.

Engenharia imediata vs. conceitos relacionados

É útil distinguir a engenharia rápida de termos relacionados:

Enriquecimento de avisos: Concentra-se em aumentar automaticamente o prompt inicial de um usuário com contexto adicional (por exemplo, de uma base de conhecimento usando RAG) antes de chegar ao LLM. A engenharia de prompts é a elaboração manual das instruções principais.
Ajuste de prompts: Uma técnica de ajuste fino eficiente de parâmetros (PEFT) em que os embeddings aprendíveis (prompts suaves) são adicionados à entrada do modelo e optimizados, em vez de criar prompts textuais.
Afinação: Envolve a atualização dos pesos reais do modelo, treinando-o mais num conjunto de dados específico, adaptando o próprio modelo e não apenas o prompt de entrada.

Embora distintas, estas técnicas podem ser complementares. Por exemplo, um prompt de base bem concebido pode ser automaticamente enriquecido com dados recuperados antes de ser processado por um modelo aperfeiçoado. Estruturas como a LangChain integram frequentemente estas diferentes abordagens.

Relevância na visão computacional

Tradicionalmente menos proeminente na Visão por Computador (CV) em comparação com a PNL, a engenharia de prontidão está a tornar-se cada vez mais relevante com o surgimento de modelos multimodais e de sistemas de visão com prontidão. Modelos como o CLIP, o YOLO ou o YOLOE podem executar tarefas como a deteção de objectos ou a segmentação de imagens com base em descrições de texto. A criação de instruções de texto eficazes (por exemplo, "detecta todos os 'carros vermelhos' mas ignora os 'camiões'") é uma forma de engenharia de instruções crucial para orientar estes modelos de linguagem de visão. Plataformas como o Ultralytics HUB facilitam a interação com vários modelos, incluindo Ultralytics YOLO modelos como o YOLOv8 e YOLO11em que a definição de tarefas através de interfaces pode beneficiar de princípios de engenharia rápida, especialmente à medida que os modelos adquirem mais capacidades interactivas.

Engenharia rápida

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Como funciona o Prompt Engineering

Técnicas de estímulo chave

Aplicações no mundo real

Engenharia imediata vs. conceitos relacionados

Relevância na visão computacional

Lê mais blogues

Junta-te à comunidade Ultralytics

Engenharia rápida

Treina os modelos YOLO simplesmentecom Ultralytics HUB

Solução flexível de licenciamento empresarial para impulsionar a tua inovação

Treina modelos de IA em segundos com Ultralytics YOLO

Treina os modelos YOLO simplesmente com Ultralytics HUB

Como funciona o Prompt Engineering

Técnicas de estímulo chave

Aplicações no mundo real

Engenharia imediata vs. conceitos relacionados

Relevância na visão computacional

Lê mais blogues

Junta-te à comunidade Ultralytics

Treina os modelos YOLO simplesmente
com Ultralytics HUB