Glossário

Engenharia rápida

Domina a arte da engenharia de prontidão para orientar modelos de IA, como os LLMs, para obter resultados precisos e de alta qualidade em conteúdos, serviço ao cliente e muito mais.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A engenharia de prompts é a prática de conceber, aperfeiçoar e estruturar os inputs (prompts) dados aos modelos de Inteligência Artificial (IA), em particular os modelos de linguagem ampla (LLM) e outros sistemas de IA generativa, para obter os resultados desejados ou óptimos. Trata-se menos de alterar o modelo em si e mais de comunicar eficazmente com o modelo utilizando instruções, perguntas ou exemplos de linguagem natural cuidadosamente elaborados. À medida que modelos como o GPT-4 se tornam mais capazes, a qualidade da mensagem influencia significativamente a qualidade, a relevância e a utilidade da resposta gerada.

O papel dos prompts

Um prompt serve como instrução ou consulta que orienta o comportamento do modelo de IA. Uma engenharia de instruções eficaz implica compreender como um modelo interpreta a linguagem e testar iterativamente diferentes frases, contextos e restrições. Este processo requer frequentemente clareza, especificidade e o fornecimento de contexto ou exemplos suficientes dentro da própria instrução. As técnicas vão desde instruções simples a métodos mais complexos, como a apresentação de exemplos(Few-Shot Learning) ou a orientação do processo de raciocínio do modelo(Chain-of-Thought Prompting). O objetivo é colmatar a lacuna entre a intenção humana e as capacidades de geração de resultados do modelo, que são frequentemente exploradas em domínios como o Processamento de Linguagem Natural (PNL).

Principais diferenças em relação a outras técnicas

O Prompt Engineering difere fundamentalmente de outras técnicas de otimização de Aprendizagem Automática (ML):

  • Afinação: O ajuste fino envolve o treinamento adicional de um modelo pré-treinado em um conjunto de dados específico para adaptar os pesos internos do modelo para uma tarefa especializada. A engenharia imediata, por outro lado, trabalha com o modelo existente sem retreinamento, concentrando-se apenas na elaboração da entrada.
  • Ajuste de hiperparâmetros: Envolve a otimização de parâmetros que controlam o próprio processo de aprendizagem (como a taxa de aprendizagem ou o tamanho do lote) durante a formação do modelo. A engenharia imediata ocorre durante o tempo de inferência, otimizando a entrada para o modelo já treinado. Podes explorar os guias de ajuste de hiperparâmetros para obteres mais detalhes sobre esse processo.
  • Engenharia de caraterísticas: Normalmente utilizada no ML tradicional, envolve a seleção, transformação ou criação de caraterísticas a partir de dados em bruto para melhorar o desempenho do modelo. A engenharia de prompts trata da criação de entradas de linguagem natural para modelos generativos e não da manipulação de caraterísticas de dados tabulares.

Aplicações no mundo real

A engenharia rápida é fundamental em várias aplicações de IA:

  1. Criação de conteúdos: Os profissionais de marketing utilizam a engenharia de solicitações para gerar tipos específicos de texto criativo, tais como esboços de publicações em blogues, variações de textos de anúncios ou legendas para redes sociais, especificando o tom, o estilo, o público-alvo e as palavras-chave. Por exemplo, ao pedir a um modelo "Escreve três títulos apelativos para uma campanha de marketing por correio eletrónico dirigida a proprietários de pequenas empresas sobre gestão de inventário com recurso a IA", obtém resultados mais direcionados do que um genérico "Escreve títulos de correio eletrónico". Isto aproveita as capacidades de geração de texto dos LLMs.
  2. Chatbots de apoio ao cliente: Os programadores criam prompts para definir a personalidade de um chatbot (por exemplo, amigável, formal), o âmbito do conhecimento e os fluxos de trabalho específicos para lidar com as questões dos utilizadores. Uma mensagem pode instruir o bot: "És um agente de apoio útil da Ultralytics. Responde educadamente às perguntas dos utilizadores sobre as licenças de software Ultralytics YOLO . Se te perguntarem sobre preços, encaminha-os para a página de preços". Isto garante interações consistentes e úteis, utilizando potencialmente técnicas como a Geração Aumentada por Recuperação (RAG) para aceder a informações específicas. Podes saber mais sobre como funcionam os LLMs para compreender a tecnologia subjacente.

Importância e futuro

À medida que os modelos de IA se integram em sistemas mais complexos, desde a geração de código à investigação científica, a capacidade de os orientar eficazmente através da engenharia rápida torna-se cada vez mais vital. Requer uma mistura de competências linguísticas, conhecimento do domínio e uma compreensão das capacidades e limitações do modelo de IA. Estruturas como a LangChain e recursos como a documentação da API OpenAI fornecem ferramentas e boas práticas para este domínio em evolução. Garantir o uso responsável também envolve considerar a ética da IA e mitigar possíveis vieses na IA por meio de um design cuidadoso e rápido. A exploração do Ultralytics HUB pode fornecer informações sobre a gestão de modelos e projectos de IA em que possam surgir considerações de alerta. Continua a investigação para explorar estratégias mais avançadas, incluindo a otimização automática de mensagens e a compreensão das nuances da interação entre humanos e IA.

Lê tudo