Glossário

Geração Aumentada de Recuperação (RAG)

Descobre como o Retrieval Augmented Generation (RAG) revoluciona a PNL, combinando a recuperação de conhecimentos externos com a geração de texto para obter resultados precisos e actualizados.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Geração Aumentada por Recuperação (RAG) é uma abordagem inovadora no domínio do processamento de linguagem natural (PNL) que melhora as capacidades dos modelos linguísticos integrando a recuperação de conhecimentos externos no processo de geração de texto. Ao contrário dos modelos tradicionais que se baseiam apenas nos seus conhecimentos pré-treinados, os modelos RAG vão buscar dinamicamente informações relevantes a um vasto corpus de documentos para informar e enriquecer as suas respostas. Este método melhora significativamente a precisão, a relevância e a profundidade do texto gerado, tornando-o particularmente útil em aplicações que requerem informações actualizadas ou específicas.

Como funciona a Geração Aumentada de Recuperação

Os modelos RAG combinam os pontos fortes das abordagens baseadas na recuperação e na geração. O processo envolve normalmente dois componentes principais: um recuperador e um gerador. Quando é apresentada uma consulta, o recuperador analisa uma grande base de dados de documentos e seleciona as passagens mais relevantes com base no contexto da consulta. Estas passagens recuperadas são depois introduzidas no gerador, que utiliza esta informação para produzir uma resposta coerente e contextualmente adequada. O gerador é frequentemente um modelo de transformador, semelhante aos utilizados no GPT (Generative Pre-trained Transformer) ou no BERT (Bidirectional Encoder Representations from Transformers), mas com a capacidade adicional de incorporar informações externas.

Principais componentes do RAG

O componente recuperador é responsável por identificar e ir buscar documentos ou passagens relevantes a uma fonte de conhecimento externa. Este componente utiliza frequentemente técnicas como TF-IDF, BM25, ou dense embeddings para medir a semelhança entre a consulta e os documentos. O componente gerador é um modelo sequência-a-sequência que utiliza a informação recuperada e a consulta original para gerar o resultado final. Este componente é treinado para sintetizar informações de várias fontes e produzir uma resposta fluente e informativa.

Vantagens da utilização do RAG

Os modelos RAG oferecem várias vantagens em relação aos modelos tradicionais de grandes línguas (LLM). Ao basear o processo de geração em informações externas e verificáveis, os modelos RAG podem produzir resultados mais precisos e fiáveis. Isto reduz o risco de alucinações, em que o modelo gera informação plausível mas incorrecta. Além disso, os modelos RAG podem adaptar-se facilmente a novas informações, actualizando a base de dados de recuperação, o que os torna mais flexíveis e actualizados em comparação com os modelos que se baseiam apenas em conhecimentos estáticos e pré-treinados.

Aplicações do RAG no mundo real

Resposta melhorada a perguntas

Os modelos RAG são excelentes em tarefas de resposta a perguntas, especialmente quando as respostas requerem informações específicas, actualizadas ou de nicho. Por exemplo, um chatbot de apoio ao cliente com RAG pode obter a documentação mais recente do produto ou as FAQs para dar respostas precisas e úteis às perguntas dos utilizadores. Desta forma, garante que os clientes recebem as informações mais actualizadas sem a necessidade de voltar a treinar o modelo com frequência.

Criação e resumo de conteúdos

O RAG pode ser utilizado para gerar conteúdos informativos de alta qualidade, recolhendo factos, estatísticas e detalhes relevantes de várias fontes. Por exemplo, um modelo RAG pode ajudar a escrever artigos noticiosos, recuperando os últimos acontecimentos e pontos de dados relacionados com o tópico. Da mesma forma, na sumarização de textos, o RAG pode produzir resumos mais abrangentes e precisos, incorporando informações de vários documentos.

RAG vs. outros modelos linguísticos

Em comparação com outros modelos de linguagem como o GPT, a capacidade do RAG para aceder e utilizar conhecimentos externos distingue-o. Embora os modelos GPT, como o GPT-3 e o GPT-4, sejam poderosos na geração de texto semelhante ao humano, estão limitados pelos dados em que foram treinados. Em contrapartida, o RAG melhora o processo de geração, recuperando dinamicamente informações relevantes, o que conduz a resultados mais informados e precisos. Esta distinção torna o RAG particularmente valioso em cenários em que a exatidão e a informação actualizada são cruciais.

Desafios e direcções futuras

Apesar das suas vantagens, as RAG também enfrentam desafios. A qualidade do resultado gerado depende em grande medida da eficácia do recuperador. Se o recuperador não conseguir obter documentos relevantes, o resultado do gerador pode ser afetado. Além disso, a integração e o processamento de informações de várias fontes podem ser computacionalmente intensivos. As futuras direcções de investigação incluem a melhoria da eficiência dos mecanismos de recuperação, a melhoria da capacidade do gerador para sintetizar informação e a exploração de novas formas de incorporar fontes de dados estruturadas e não estruturadas. Podes ler mais sobre o RAG neste documento de investigação.

Para mais informações sobre técnicas e modelos avançados de PNL, explora o blogueUltralytics .

Lê tudo