Glosario

Generación Aumentada de Recuperación (RAG)

Descubre cómo la Generación Aumentada por Recuperación (RAG) revoluciona la PNL combinando la recuperación de conocimiento externo con la generación de texto para obtener resultados precisos y actualizados.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La Generación Aumentada por Recuperación (RAG) es un enfoque innovador en el campo del procesamiento del lenguaje natural (PLN) que mejora las capacidades de los modelos lingüísticos integrando la recuperación de conocimientos externos en el proceso de generación de textos. A diferencia de los modelos tradicionales, que se basan únicamente en sus conocimientos preentrenados, los modelos RAG obtienen dinámicamente información relevante de un vasto corpus de documentos para informar y enriquecer sus respuestas. Este método mejora significativamente la precisión, relevancia y profundidad del texto generado, lo que lo hace especialmente útil en aplicaciones que requieren información actualizada o específica.

Cómo funciona la Generación Aumentada de Recuperación

Los modelos RAG combinan los puntos fuertes de los enfoques basados en la recuperación y en la generación. El proceso suele incluir dos componentes principales: un recuperador y un generador. Cuando se presenta una consulta, el recuperador explora una gran base de datos de documentos y selecciona los pasajes más relevantes basándose en el contexto de la consulta. Estos pasajes recuperados se introducen en el generador, que utiliza esta información para producir una respuesta coherente y contextualmente adecuada. El generador suele ser un modelo de transformador, similar a los utilizados en GPT (Generative Pre-trained Transformer) o BERT (Bidirectional Encoder Representations from Transformers), pero con la capacidad añadida de incorporar información externa.

Componentes clave de los GAR

El componente recuperador se encarga de identificar y obtener documentos o pasajes relevantes de una fuente de conocimiento externa. Este componente suele utilizar técnicas como TF-IDF, BM25 o incrustaciones densas para medir la similitud entre la consulta y los documentos. El componente generador es un modelo secuencia a secuencia que toma la información recuperada y la consulta original para generar el resultado final. Este componente está entrenado para sintetizar información de múltiples fuentes y producir una respuesta fluida e informativa.

Ventajas de utilizar el GAR

La RAG ofrece varias ventajas sobre los grandes modelos lingüísticos (LLM) tradicionales. Al basar el proceso de generación en información externa y verificable, los modelos RAG pueden producir resultados más precisos y fiables. Esto reduce el riesgo de alucinaciones, en las que el modelo genera información plausible pero incorrecta. Además, los modelos GAR pueden adaptarse fácilmente a la nueva información actualizando la base de datos de recuperación, lo que los hace más flexibles y actualizados en comparación con los modelos que se basan únicamente en conocimientos estáticos y preentrenados.

Aplicaciones reales del GAR

Respuesta a preguntas mejorada

Los modelos RAG destacan en las tareas de respuesta a preguntas, especialmente cuando las respuestas requieren información específica, actualizada o de nicho. Por ejemplo, un chatbot de atención al cliente impulsado por RAG puede recuperar la documentación más reciente del producto o las preguntas más frecuentes para proporcionar respuestas precisas y útiles a las consultas de los usuarios. Esto garantiza que los clientes reciban la información más actualizada sin necesidad de un reentrenamiento frecuente del modelo.

Creación y resumen de contenidos

La GAR puede utilizarse para generar contenidos informativos de alta calidad, extrayendo hechos, estadísticas y detalles relevantes de diversas fuentes. Por ejemplo, un modelo RAG puede ayudar a redactar artículos de noticias recuperando los últimos acontecimientos y puntos de datos relacionados con el tema. Del mismo modo, en el resumen de textos, la RAG puede producir resúmenes más completos y precisos incorporando información de múltiples documentos.

RAG frente a otros modelos lingüísticos

En comparación con otros modelos lingüísticos como GPT, la capacidad de RAG para acceder y utilizar conocimientos externos lo distingue. Aunque los modelos GPT como GPT-3 y GPT-4 son potentes a la hora de generar texto similar al humano, están limitados por los datos con los que fueron entrenados. En cambio, RAG mejora el proceso de generación recuperando dinámicamente la información relevante, lo que da lugar a resultados más informados y precisos. Esta distinción hace que el RAG sea especialmente valioso en situaciones en las que la precisión y la información actualizada son cruciales.

Retos y orientaciones futuras

A pesar de sus ventajas, el GAR también se enfrenta a retos. La calidad del resultado generado depende en gran medida de la eficacia del recuperador. Si el recuperador no recupera los documentos relevantes, el resultado del generador puede verse afectado. Además, la integración y el procesamiento de la información procedente de múltiples fuentes puede requerir un gran esfuerzo informático. Las futuras líneas de investigación incluyen mejorar la eficacia de los mecanismos de recuperación, mejorar la capacidad del generador para sintetizar información y explorar nuevas formas de incorporar fuentes de datos estructuradas y no estructuradas. Puedes leer más sobre el GAR en este documento de investigación.

Para más información sobre técnicas y modelos avanzados de PNL, explora el BlogUltralytics .

Leer todo