Domina a IA com enriquecimento imediato! Melhora os resultados dos Large Language Models utilizando o contexto, instruções claras e exemplos para obter resultados precisos.
O enriquecimento de prompts é o processo de melhorar automaticamente ou semi-automaticamente o prompt de entrada inicial de um utilizador antes de o alimentar com um modelo de Inteligência Artificial (IA), em especial os Modelos de Linguagem de Grande Dimensão (LLM). O objetivo é acrescentar contexto relevante, clarificar ambiguidades, impor restrições ou incluir detalhes específicos que ajudem a IA a gerar uma resposta mais precisa, relevante e útil. Esta técnica melhora a qualidade da interação entre os utilizadores e os sistemas de IA, tornando os avisos mais eficazes sem exigir que o utilizador seja um perito em engenharia de avisos.
Normalmente, o processo envolve a análise do pedido original e a utilização de fontes de informação adicionais ou regras predefinidas para o aumentar. Isto pode incluir o acesso ao histórico do utilizador, a recuperação de documentos relevantes de uma base de conhecimentos, a incorporação do contexto da conversa ou a aplicação de instruções de formatação específicas. Por exemplo, um pedido vago como "Fala-me do Ultralytics YOLO" pode ser enriquecido com o contexto que especifica que o utilizador está interessado na versão mais recente(YOLOv11) ou no seu desempenho em comparação com outros modelos como YOLOv8. São frequentemente utilizadas técnicas como a Retrieval-Augmented Generation (RAG), em que o sistema vai buscar excertos de dados relevantes e adiciona-os à janela de contexto do pedido.
O enriquecimento imediato encontra aplicações em várias tarefas orientadas para a IA:
É importante distinguir o enriquecimento imediato de termos semelhantes:
Embora seja menos comum em tarefas tradicionais de visão por computador, como a deteção de objectos padrão, o conceito é relevante para modelos de visão mais recentes, como o YOLOE, que utilizam avisos de texto ou imagem que podem beneficiar potencialmente do enriquecimento contextual para um melhor desempenho de zero-shot. Plataformas como o Ultralytics HUB poderiam potencialmente incorporar essas técnicas para simplificar a interação do utilizador ao definir tarefas de visão complexas.