Glossário

Geração Aumentada de Recuperação (RAG)

Melhora a tua PNL com o RAG, integrando modelos de recuperação e generativos para uma geração de texto precisa e contextualmente rica. Descobre agora a IA de ponta!

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A Geração Aumentada de Recuperação (RAG) é uma abordagem de ponta no processamento de linguagem natural (PNL) que combina os pontos fortes dos sistemas de recuperação e dos modelos generativos para melhorar a geração de texto mais exato e contextualmente relevante. Esta técnica inovadora aborda algumas das limitações dos modelos linguísticos tradicionais, que podem, por vezes, gerar texto que carece de pormenores específicos ou de contexto.

Como funciona o RAG

Os sistemas RAG começam por recuperar informações relevantes de uma base de dados ou de uma coleção de documentos com base numa determinada consulta. Esta etapa de recuperação permite ao sistema aceder a uma grande quantidade de dados externos que podem enriquecer o processo generativo. Uma vez recuperada a informação mais pertinente, um modelo generativo utiliza estes dados para produzir texto que é informado pelas fontes externas. Este processo garante que o resultado gerado é não só fluente, mas também factualmente exato e contextualmente apropriado.

Componentes principais

  • Sistema de recuperação: Este componente pesquisa em grandes conjuntos de dados para encontrar trechos relevantes de informações. Exemplos de tais sistemas incluem o Elasticsearch ou bases de dados especializadas que o modelo de recuperação pode consultar.
  • Modelo generativo: Normalmente baseado em grandes modelos linguísticos (LLM), como o GPT ou o BERT, o modelo generativo produz texto aproveitando a informação recuperada.

Relevância e aplicações

O RAG é particularmente importante em cenários em que a precisão e o contexto são fundamentais. Isto é vital em aplicações como:

  • Resposta a perguntas: Aumenta a precisão das respostas, baseando-as numa base de dados de informação factual.
  • Apoio ao cliente: Fornecer respostas detalhadas e precisas acedendo a uma base de conhecimentos.
  • Criação de conteúdos: Gerar conteúdos informativos que reflictam informações actualizadas e relevantes.

Distinguir RAG de conceitos semelhantes

Embora semelhante aos modelos baseados na recuperação e aos modelos generativos de forma independente, o RAG integra de forma única ambos os componentes para ultrapassar as limitações observadas em cada um deles quando utilizados isoladamente. Ao contrário dos modelos puramente generativos, que podem sofrer com a geração de texto coerente, mas potencialmente impreciso, o RAG garante a exatidão ao basear a geração nos dados recuperados.

Exemplos do mundo real

Exemplo 1: Sistemas de apoio ao cliente

Nas aplicações de apoio ao cliente, o RAG pode ser utilizado para fornecer automaticamente respostas precisas aos pedidos de informação dos clientes, recuperando dados de bases de conhecimento internas. Isto garante que as respostas são relevantes e cumprem a política da empresa, aumentando significativamente a eficiência e a satisfação do cliente.

Exemplo 2: Assistência à investigação

O RAG também é utilizado em ambientes de investigação, onde ajuda os investigadores a gerar revisões da literatura ou resumos baseados em artigos de investigação actuais. Ao recuperar e incorporar informações actualizadas, o modelo garante que o texto gerado é abrangente e factualmente correto.

Exploração adicional

A Retrieval Augmented Generation exemplifica a evolução contínua das tecnologias de IA, prometendo soluções mais inteligentes e fiáveis em vários domínios. À medida que estes sistemas continuam a avançar, espera-se que a sua capacidade de fornecer informações precisas e baseadas em dados aumente, transformando a forma como a informação é acedida e utilizada.

Lê tudo