Thuật ngữ

Thế hệ tăng cường truy xuất (RAG)

Nâng cao NLP của bạn với RAG, tích hợp các mô hình truy xuất và tạo ra để tạo ra văn bản chính xác, giàu ngữ cảnh. Khám phá AI tiên tiến ngay!

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Retrieval Augmented Generation (RAG) là một phương pháp tiên tiến trong xử lý ngôn ngữ tự nhiên (NLP) kết hợp các điểm mạnh của hệ thống truy xuất và mô hình tạo ra để tăng cường việc tạo ra văn bản chính xác hơn và phù hợp với ngữ cảnh hơn. Kỹ thuật cải tiến này giải quyết một số hạn chế của các mô hình ngôn ngữ truyền thống, đôi khi có thể tạo ra văn bản thiếu chi tiết hoặc ngữ cảnh cụ thể.

RAG hoạt động như thế nào

Hệ thống RAG đầu tiên sẽ lấy thông tin có liên quan từ cơ sở dữ liệu hoặc tập hợp các tài liệu dựa trên truy vấn đã cho. Bước lấy thông tin này cho phép hệ thống truy cập vào nhiều dữ liệu bên ngoài có thể làm phong phú thêm quá trình tạo ra. Sau khi lấy được thông tin có liên quan nhất, mô hình tạo ra sẽ sử dụng dữ liệu này để tạo ra văn bản được cung cấp thông tin từ các nguồn bên ngoài. Quá trình này đảm bảo rằng đầu ra được tạo ra không chỉ trôi chảy mà còn chính xác về mặt thực tế và phù hợp với ngữ cảnh.

Các thành phần chính

  • Hệ thống truy xuất : Thành phần này tìm kiếm qua các tập dữ liệu lớn để tìm các đoạn thông tin có liên quan. Ví dụ về các hệ thống như vậy bao gồm Elasticsearch hoặc các cơ sở dữ liệu chuyên biệt mà mô hình truy xuất có thể truy vấn.
  • Mô hình tạo sinh : Thường dựa trên Mô hình ngôn ngữ lớn (LLM) như GPT hoặc BERT, mô hình tạo sinh tạo ra văn bản bằng cách tận dụng thông tin đã thu thập được.

Sự liên quan và ứng dụng

RAG đặc biệt quan trọng trong các tình huống mà độ chính xác và ngữ cảnh là tối quan trọng. Điều này rất quan trọng trong các ứng dụng như:

  • Trả lời câu hỏi : Nâng cao độ chính xác của câu trả lời bằng cách dựa chúng vào cơ sở dữ liệu thông tin thực tế.
  • Hỗ trợ khách hàng : Cung cấp câu trả lời chi tiết và chính xác bằng cách truy cập vào cơ sở kiến thức.
  • Tạo nội dung : Tạo nội dung thông tin phản ánh thông tin mới nhất và có liên quan.

Phân biệt RAG với các khái niệm tương tự

Mặc dù tương tự như các mô hình dựa trên truy xuất và các mô hình tạo ra độc lập, RAG tích hợp độc đáo cả hai thành phần để khắc phục những hạn chế thấy được ở từng thành phần khi sử dụng riêng lẻ. Không giống như các mô hình tạo ra thuần túy, có thể gặp vấn đề khi tạo ra văn bản mạch lạc nhưng có khả năng không chính xác, RAG đảm bảo độ chính xác bằng cách dựa trên dữ liệu đã truy xuất để tạo ra dữ liệu.

Ví dụ thực tế

Ví dụ 1: Hệ thống hỗ trợ khách hàng

Trong các ứng dụng hỗ trợ khách hàng, RAG có thể được sử dụng để tự động cung cấp phản hồi chính xác cho các yêu cầu của khách hàng bằng cách lấy dữ liệu từ cơ sở kiến thức nội bộ. Điều này đảm bảo rằng các câu trả lời vừa có liên quan vừa tuân thủ chính sách của công ty, giúp tăng đáng kể hiệu quả và sự hài lòng của khách hàng.

Ví dụ 2: Hỗ trợ nghiên cứu

RAG cũng được sử dụng trong môi trường nghiên cứu, nơi nó hỗ trợ các nhà nghiên cứu bằng cách tạo ra các bài đánh giá hoặc tóm tắt tài liệu dựa trên các bài nghiên cứu hiện tại. Bằng cách truy xuất và kết hợp thông tin cập nhật, mô hình đảm bảo rằng văn bản được tạo ra là toàn diện và chính xác về mặt thực tế.

Khám phá thêm

  • Tìm hiểu thêm về Transformers , một thành phần kiến trúc quan trọng trong các mô hình tạo sinh, trên Ultralytics Thuật ngữ.
  • Khám phá Ultralytics blog về AI tạo sinh để hiểu những đổi mới gần đây và tác động của chúng.

  • Khám phá các hoạt động AI có thể giải thích để tìm hiểu cách duy trì tính minh bạch trong các mô hình AI.

  • Khám phá Ultralytics HUB của chúng tôi để tích hợp và triển khai máy học liền mạch.

  • Tìm hiểu khái niệm Mô hình ngôn ngữ lớn (LLM) , tạo thành nền tảng của nhiều mô hình tạo sinh.

Retrieval Augmented Generation minh họa cho sự phát triển liên tục của công nghệ AI, hứa hẹn các giải pháp thông minh hơn và đáng tin cậy hơn trên nhiều lĩnh vực khác nhau. Khi các hệ thống này tiếp tục phát triển, khả năng cung cấp thông tin chi tiết chính xác dựa trên dữ liệu của chúng dự kiến sẽ tăng lên, biến đổi cách truy cập và sử dụng thông tin.

Đọc tất cả