Thuật ngữ

Chuỗi nhắc nhở

Khám phá chuỗi nhắc nhở: một kỹ thuật AI từng bước giúp tăng cường độ chính xác, khả năng kiểm soát và độ chính xác cho các tác vụ phức tạp với Mô hình ngôn ngữ lớn.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Chuỗi nhắc nhở là một kỹ thuật được sử dụng trong Trí tuệ nhân tạo (AI) để quản lý các tác vụ phức tạp bằng cách chia nhỏ chúng thành một chuỗi các lời nhắc đơn giản hơn, được kết nối với nhau. Thay vì sử dụng một lời nhắc lớn, có khả năng khó sử dụng để đạt được mục tiêu, chuỗi nhắc nhở liên quan đến việc đưa đầu ra của phản hồi của một mô hình AI (thường là Mô hình ngôn ngữ lớn hoặc LLM ) làm đầu vào cho lời nhắc tiếp theo trong chuỗi. Phương pháp tiếp cận theo mô-đun này cho phép kiểm soát tốt hơn, cải thiện độ chính xác và khả năng xử lý các lý luận hoặc quy trình công việc phức tạp hơn, giúp các tác vụ AI phức tạp dễ quản lý hơn.

Cách thức hoạt động của Prompt Chaining

Ý tưởng cốt lõi đằng sau chuỗi nhắc nhở là phân tích tác vụ. Một vấn đề phức tạp, mà AI có thể khó giải quyết chính xác trong một bước, được chia thành các tác vụ phụ nhỏ hơn, dễ quản lý hơn. Mỗi tác vụ phụ được giải quyết bằng một lời nhắc cụ thể trong chuỗi. AI xử lý lời nhắc đầu tiên, tạo ra đầu ra và đầu ra này (hoặc phiên bản đã xử lý của đầu ra đó) trở thành một phần của đầu vào cho lời nhắc thứ hai, v.v. Quy trình từng bước này hướng dẫn AI thực hiện tác vụ, đảm bảo rằng mỗi giai đoạn xây dựng hợp lý dựa trên giai đoạn trước đó. Phương pháp này trái ngược với việc cố gắng giải quyết toàn bộ vấn đề bằng một lời nhắc duy nhất, thường phức tạp và kém tin cậy hơn. Các khuôn khổ như LangChain thường được sử dụng để triển khai các chuỗi như vậy, đơn giản hóa việc sắp xếp các quy trình nhiều bước này. Luồng thông tin giữa các lời nhắc là chìa khóa thành công của chuỗi.

Lợi ích và ứng dụng

Chuỗi nhắc nhở mang lại một số lợi thế cho việc phát triển các hệ thống AI phức tạp:

  • Độ chính xác và độ tin cậy được cải thiện: Chia nhỏ các tác vụ làm giảm độ phức tạp ở mỗi bước, dẫn đến kết quả trung gian và cuối cùng chính xác hơn. Sự tinh chỉnh từng bước này giảm thiểu khả năng xảy ra lỗi hoặc ảo giác AI .
  • Kiểm soát và gỡ lỗi nâng cao: Mỗi bước trong chuỗi có thể được theo dõi, đánh giá và gỡ lỗi riêng lẻ, giúp xác định và khắc phục sự cố dễ dàng hơn so với việc khắc phục sự cố một lời nhắc đơn khối. Điều này phù hợp với các thông lệ tốt nhất trong MLOps .
  • Xử lý độ phức tạp: Cho phép AI giải quyết các nhiệm vụ đòi hỏi nhiều giai đoạn lý luận, truy xuất thông tin hoặc chuyển đổi mà quá phức tạp đối với một lời nhắc duy nhất. Điều này rất quan trọng để xây dựng các tác nhân AI tiên tiến.
  • Tính mô-đun và khả năng tái sử dụng: Các lời nhắc hoặc chuỗi con riêng lẻ có khả năng được tái sử dụng trên nhiều quy trình công việc khác nhau, thúc đẩy hiệu quả trong quá trình phát triển. Tính mô-đun này là nguyên tắc cốt lõi trong kỹ thuật phần mềm .

Ví dụ thực tế:

  1. Tự động hóa hỗ trợ khách hàng: MỘT trò chuyện sử dụng chuỗi nhắc nhở để xử lý truy vấn của người dùng.
    • Yêu cầu 1: Phân tích yêu cầu của người dùng để xác định mục đích và các thực thể chính (ví dụ: tên sản phẩm, loại sự cố).
    • Yêu cầu 2: Sử dụng các thực thể được trích xuất để tìm kiếm trong cơ sở kiến thức các bài viết khắc phục sự cố hoặc câu hỏi thường gặp có liên quan.
    • Yêu cầu 3: Tóm tắt thông tin thu thập được dựa trên vấn đề cụ thể của người dùng.
    • Yêu cầu 4: Đưa ra phản hồi rõ ràng, đồng cảm với người dùng bằng cách kết hợp phần tóm tắt.
  2. Tích hợp tầm nhìn và ngôn ngữ cho báo cáo: Tạo báo cáo mô tả từ hình ảnh được chụp bởi hệ thống an ninh.
    • Yêu cầu 1 (Đầu vào: Hình ảnh): Sử dụng mô hình YOLO Ultralytics để phát hiện đối tượng nhằm xác định đối tượng và vị trí của chúng ( hộp giới hạn ).
    • Yêu cầu 2 (Đầu vào: Danh sách đối tượng): Cung cấp danh sách các đối tượng và vị trí được phát hiện cho LLM để tạo bản tóm tắt văn bản mô tả về cảnh.
    • Yêu cầu 3 (Đầu vào: Tóm tắt cảnh + Bối cảnh): Sử dụng mô tả cảnh và bối cảnh bổ sung (ví dụ: thời gian, địa điểm) để tạo báo cáo sự cố có cấu trúc bằng cách sử dụng khả năng tạo văn bản . Điều này kết hợp thị giác máy tínhxử lý ngôn ngữ tự nhiên (NLP) .

Chuỗi nhắc nhở so với các khái niệm liên quan

Sẽ rất hữu ích khi phân biệt chuỗi nhắc nhở với các kỹ thuật tương tự:

  • Kỹ thuật nhắc nhở : Đây là phương pháp chung để thiết kế các nhắc nhở hiệu quả cho các mô hình AI. Chuỗi nhắc nhở là một kỹ thuật cụ thể trong kỹ thuật nhắc nhở, tập trung vào việc cấu trúc nhiều nhắc nhở theo trình tự.
  • Gợi ý chuỗi suy nghĩ (CoT) : CoT nhằm mục đích cải thiện khả năng lý luận của LLM trong một gợi ý duy nhất bằng cách yêu cầu họ "suy nghĩ từng bước". Ngược lại, gợi ý chuỗi chia nhỏ nhiệm vụ thành nhiều bước gợi ý riêng biệt , có khả năng liên quan đến các mô hình hoặc công cụ khác nhau ở mỗi bước.
  • Retrieval-Augmented Generation (RAG) : RAG là một kỹ thuật trong đó mô hình AI lấy thông tin có liên quan từ nguồn kiến thức bên ngoài trước khi tạo phản hồi. RAG thường được sử dụng như một bước cụ thể trong chuỗi nhắc nhở lớn hơn (ví dụ: tìm kiếm cơ sở kiến thức trong ví dụ hỗ trợ khách hàng). Tìm hiểu thêm về hệ thống RAG .
  • Làm giàu lời nhắc : Điều này liên quan đến việc tự động thêm ngữ cảnh hoặc chi tiết vào lời nhắc ban đầu của người dùng trước khi nó được gửi đến AI. Mặc dù nó cải thiện một lời nhắc duy nhất, nhưng nó không liên quan đến việc xử lý tuần tự nhiều lời nhắc được kết nối với nhau như chuỗi.
  • Prompt Tuning : Một phương pháp tinh chỉnh hiệu quả tham số (PEFT) liên quan đến việc học "lời nhắc mềm" cụ thể ( nhúng ) thay vì tạo lời nhắc văn bản. Đây là một kỹ thuật đào tạo mô hình, khác biệt với cấu trúc thực thi thời gian chạy của chuỗi lời nhắc.

Chuỗi nhắc là một phương pháp mạnh mẽ để cấu trúc các tương tác với các mô hình AI tiên tiến như LLM và thậm chí tích hợp chúng với các hệ thống AI khác như các hệ thống được sử dụng để phân loại hình ảnh hoặc phân đoạn thể hiện . Nó làm cho các tác vụ phức tạp dễ xử lý hơn và cải thiện độ tin cậy của kết quả trong nhiều ứng dụng học máy , từ phân tích dữ liệu cơ bản đến các hệ thống AI đa phương thức phức tạp. Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạotriển khai các mô hình có thể tạo thành các thành phần của các chuỗi như vậy.

Đọc tất cả