Thuật ngữ

Thu hồi tăng cường thế hệ (RAG)

Khám phá cách Retrieval Augmented Generation (RAG) tăng cường các mô hình AI bằng cách tích hợp dữ liệu bên ngoài đáng tin cậy, thời gian thực để có phản hồi chính xác và cập nhật.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Retrieval Augmented Generation (RAG) là một phương pháp tiếp cận sáng tạo để nâng cao khả năng của các mô hình AI tạo sinh, đặc biệt là các Mô hình ngôn ngữ lớn (LLM). Nó giải quyết một hạn chế chính của các LLM tiêu chuẩn: sự phụ thuộc hoàn toàn vào dữ liệu được đào tạo trước, có thể dẫn đến kết quả không chính xác về mặt thực tế, lỗi thời hoặc thiếu sự hiểu biết về ngữ cảnh cụ thể. RAG khắc phục những vấn đề này bằng cách cho phép các mô hình truy cập và kết hợp thông tin từ các nguồn bên ngoài theo thời gian thực trong quá trình tạo.

Retrieval Augmented Generation (RAG) là gì?

Retrieval Augmented Generation (RAG) là một kỹ thuật làm phong phú thêm kiến thức của LLM bằng cách cho phép họ truy xuất thông tin từ các cơ sở kiến thức bên ngoài trước khi tạo phản hồi. Không giống như các mô hình chỉ dựa vào các tham số được đào tạo trước, nội bộ của chúng, các mô hình dựa trên RAG truy cập và tích hợp thông tin có liên quan một cách động từ các nguồn bên ngoài như tài liệu, cơ sở dữ liệu hoặc web. Quá trình này thực sự thu hẹp khoảng cách giữa kiến thức chung rộng lớn được nhúng trong LLM và nhu cầu về thông tin hiện tại, chính xác hoặc cụ thể theo lĩnh vực. Điều này đảm bảo rằng nội dung được tạo ra không chỉ có liên quan theo ngữ cảnh mà còn dựa trên các sự kiện cập nhật và đáng tin cậy.

RAG hoạt động như thế nào

Quá trình Tạo ra Tăng cường Truy xuất thường bao gồm hai giai đoạn chính hoạt động song song:

  1. Giai đoạn truy xuất : Khi người dùng đưa ra truy vấn, hệ thống RAG trước tiên sử dụng cơ chế truy xuất để tìm kiếm thông tin có liên quan từ một nguồn kiến thức được chỉ định. Nguồn kiến thức này có thể là cơ sở dữ liệu vector của các tài liệu, một tập hợp các trang web hoặc bất kỳ kho lưu trữ dữ liệu có cấu trúc hoặc không có cấu trúc nào. Các kỹ thuật như tìm kiếm ngữ nghĩa và so khớp tương tự thường được sử dụng để xác định và truy xuất các tài liệu hoặc khối thông tin có liên quan nhất. Các phương pháp này tận dụng nhúng để hiểu ý nghĩa và ngữ cảnh của cả truy vấn và thông tin trong cơ sở kiến thức, đảm bảo rằng việc truy xuất không chỉ dựa trên từ khóa mà còn được căn chỉnh về mặt khái niệm.

  2. Giai đoạn tăng cường và tạo : Sau khi thông tin có liên quan được truy xuất, thông tin đó sẽ được "tăng cường" hoặc kết hợp với truy vấn gốc của người dùng. Lời nhắc tăng cường này sau đó được đưa vào LLM. LLM sử dụng ngữ cảnh được làm giàu này—cả truy vấn gốc và kiến thức đã truy xuất—để tạo ra phản hồi chính xác và có thông tin hơn. Quy trình này đảm bảo rằng đầu ra của mô hình dựa trên các sự kiện và ngữ cảnh bên ngoài, thay vì chỉ dựa vào dữ liệu tiền đào tạo có khả năng bị giới hạn hoặc lỗi thời. Các kỹ thuật như kỹ thuật nhắc đóng vai trò quan trọng trong việc kết hợp hiệu quả thông tin đã truy xuất vào quy trình tạo, hướng dẫn LLM tạo ra các câu trả lời mạch lạc và có liên quan.

Ứng dụng của RAG

RAG đang chứng tỏ là một kỹ thuật đa năng có ứng dụng trong nhiều lĩnh vực khác nhau:

  • Chatbot hỗ trợ khách hàng nâng cao : Trong dịch vụ khách hàng, chatbot do RAG cung cấp có thể cung cấp phản hồi chính xác và hữu ích hơn bằng cách lấy thông tin từ các cơ sở kiến thức, câu hỏi thường gặp và tài liệu sản phẩm mới nhất. Điều này đảm bảo rằng người dùng nhận được câu trả lời hiện tại và cụ thể, cải thiện sự hài lòng của khách hàng và giảm nhu cầu can thiệp của con người đối với các truy vấn phổ biến. Khám phá thêm về chatbot và ứng dụng của chúng.

  • Hỗ trợ nghiên cứu và tạo nội dung : Đối với những người sáng tạo nội dung và nhà nghiên cứu, hệ thống RAG có thể hỗ trợ tạo ra các bài viết, báo cáo và bài nghiên cứu bằng cách cung cấp quyền truy cập vào kho thông tin khổng lồ. Bằng cách dựa trên các dữ liệu và sự kiện đã thu thập được, RAG giúp đảm bảo độ chính xác về mặt sự kiện và giảm nguy cơ đạo văn. Điều này đặc biệt hữu ích trong các lĩnh vực yêu cầu thông tin cập nhật hoặc đào sâu vào các chủ đề cụ thể. Tìm hiểu thêm về các kỹ thuật tạo văn bản .

  • Hệ thống quản lý kiến thức nội bộ : Các doanh nghiệp có thể sử dụng RAG để xây dựng hệ thống quản lý kiến thức nội bộ cho phép nhân viên nhanh chóng truy cập và tổng hợp thông tin từ các tài liệu, wiki và cơ sở dữ liệu của công ty. Điều này có thể cải thiện hiệu quả, tạo điều kiện ra quyết định tốt hơn và hợp lý hóa quy trình tuyển dụng bằng cách làm cho kiến thức của tổ chức dễ dàng truy cập.

RAG so với tinh chỉnh

Mặc dù cả RAG và tinh chỉnh đều nhằm mục đích điều chỉnh LLM cho các trường hợp sử dụng cụ thể, nhưng chúng hoạt động khác nhau:

  • Retrieval Augmented Generation (RAG) : RAG tăng cường quá trình tạo bằng cách lấy thông tin có liên quan bên ngoài tại thời điểm truy vấn. Nó giữ nguyên các tham số của mô hình và dựa vào các nguồn kiến thức bên ngoài để có thông tin cập nhật và cụ thể theo miền. RAG có lợi thế khi xử lý thông tin thay đổi thường xuyên hoặc khi mô hình cần truy cập vào một lượng lớn dữ liệu không thực tế để đưa vào các tham số của mô hình.

  • Tinh chỉnh : Mặt khác, tinh chỉnh liên quan đến việc sửa đổi các tham số bên trong của một mô hình được đào tạo trước bằng cách đào tạo nó trên một tập dữ liệu mới, cụ thể cho từng tác vụ. Tinh chỉnh có hiệu quả trong việc điều chỉnh một mô hình theo một phong cách, miền hoặc tác vụ cụ thể, nhưng nó cập nhật kiến thức cốt lõi của mô hình và yêu cầu đào tạo lại để kết hợp thông tin mới. Khám phá khái niệm tinh chỉnhhọc chuyển giao để hiểu rõ hơn.

RAG cung cấp một phương pháp linh hoạt và hiệu quả hơn để kết hợp kiến thức bên ngoài và đang phát triển mà không cần phải đào tạo lại toàn bộ mô hình, khiến nó trở thành lựa chọn thiết thực cho các ứng dụng yêu cầu phản hồi cập nhật và phong phú theo ngữ cảnh.

Lợi ích của RAG

Việc áp dụng RAG mang lại một số lợi ích chính:

  • Độ chính xác và độ tin cậy được cải thiện : Bằng cách dựa trên các phản hồi từ các nguồn bên ngoài có thể xác minh được, RAG làm giảm đáng kể các lỗi thực tế và ảo giác trong LLM , dẫn đến kết quả đáng tin cậy hơn.
  • Truy cập thông tin mới nhất : RAG có thể truy cập và kết hợp thông tin mới nhất từ các cơ sở kiến thức trực tuyến, đảm bảo phản hồi là hiện tại và phù hợp, một lợi thế quan trọng trong các lĩnh vực đang phát triển nhanh chóng.
  • Tăng cường tính liên quan theo ngữ cảnh : RAG đảm bảo rằng nội dung được tạo ra có liên quan cao đến truy vấn và ngữ cảnh của người dùng bằng cách truy xuất và kết hợp thông tin có liên quan một cách động.
  • Giảm ảo giác : Bằng cách tham chiếu chéo và xác thực thông tin với các nguồn bên ngoài, RAG giảm thiểu việc tạo ra nội dung bịa đặt hoặc vô nghĩa, một vấn đề thường gặp trong các mô hình hoàn toàn mang tính sinh sản.
  • Cập nhật kiến thức tiết kiệm chi phí : Việc cập nhật kiến thức trong hệ thống RAG cũng đơn giản như việc cập nhật cơ sở kiến thức bên ngoài, ít tốn kém tài nguyên hơn nhiều so với việc đào tạo lại hoặc tinh chỉnh một mô hình ngôn ngữ lớn.
Đọc tất cả