Thuật ngữ

Học tập Zero-Shot

Khám phá Zero-Shot Learning: phương pháp AI tiên tiến cho phép các mô hình phân loại dữ liệu chưa thấy, cách mạng hóa phát hiện đối tượng, NLP, v.v.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Zero-Shot Learning (ZSL) đại diện cho một lĩnh vực hấp dẫn trong Machine Learning (ML) nơi một mô hình được đào tạo để nhận dạng và phân loại các danh mục dữ liệu mà nó chưa từng thấy rõ ràng trong giai đoạn đào tạo. Không giống như các phương pháp học có giám sát truyền thống yêu cầu các ví dụ được gắn nhãn cho mọi danh mục có thể, ZSL hướng đến việc khái quát hóa kiến thức từ các lớp đã thấy sang các lớp chưa thấy bằng cách sử dụng thông tin phụ trợ được chia sẻ. Khả năng này đặc biệt có giá trị trong các tình huống thực tế khi việc thu thập dữ liệu được gắn nhãn cho mọi danh mục có thể hình dung được là không thực tế hoặc không thể.

Học tập Zero-Shot hoạt động như thế nào

Ý tưởng cốt lõi đằng sau ZSL là tìm hiểu ánh xạ giữa không gian đặc điểm đầu vào (ví dụ: đặc điểm hình ảnh hoặc đặc điểm văn bản) và không gian nhúng ngữ nghĩa. Không gian ngữ nghĩa này thường mã hóa các thuộc tính hoặc đặc điểm mô tả cấp cao được chia sẻ giữa cả lớp nhìn thấy và lớp không nhìn thấy. Ví dụ, trong thị giác máy tính , chúng có thể là các thuộc tính trực quan như 'có sọc', 'có lông', 'có cánh' hoặc mô tả dựa trên văn bản. Trong Xử lý ngôn ngữ tự nhiên (NLP) , nhúng từ thường đóng vai trò là không gian ngữ nghĩa này.

Trong quá trình đào tạo, mô hình học cách liên kết các tính năng của các lớp đã thấy với các biểu diễn ngữ nghĩa tương ứng của chúng (ví dụ: thuộc tính hoặc nhúng). Tại thời điểm suy luận, khi được trình bày với một trường hợp của một lớp chưa thấy, mô hình sẽ trích xuất các tính năng của nó và ánh xạ chúng vào không gian ngữ nghĩa đã học. Bằng cách so sánh ánh xạ này với các biểu diễn ngữ nghĩa đã biết của các lớp chưa thấy (được cung cấp riêng), mô hình có thể dự đoán nhãn lớp ngay cả khi không có ví dụ trước đó. Các mô hình Học sâu , đặc biệt là các mô hình sử dụng các kỹ thuật như học tương phản như CLIP , thường được sử dụng cho các tác vụ ZSL do khả năng học các biểu diễn tính năng phong phú của chúng. Bạn có thể khám phá nhiều tập dữ liệu khác nhau phù hợp cho các tác vụ như vậy, như những tập dữ liệu được liệt kê trong tài liệu Bộ dữ liệu Ultralytics .

Ứng dụng trong thế giới thực

Zero-Shot Learning cho phép áp dụng mạnh mẽ trên nhiều lĩnh vực khác nhau:

  1. Nhận dạng đối tượng mới: Trong phân loại hình ảnh hoặc phát hiện đối tượng , ZSL cho phép các hệ thống xác định các đối tượng không có trong dữ liệu đào tạo ban đầu. Ví dụ, một hệ thống giám sát động vật hoang dã được đào tạo trên các loài động vật phổ biến có khả năng xác định một loài hiếm hoặc mới được phát hiện dựa trên mô tả văn bản hoặc một tập hợp các thuộc tính ngữ nghĩa do các chuyên gia cung cấp. Các mô hình như Ultralytics YOLO -World tận dụng khả năng này để phát hiện từ vựng mở.
  2. Phân loại nội dung động: ZSL có thể phân loại tài liệu, bài viết tin tức hoặc nội dung do người dùng tạo thành các chủ đề mới nổi mà không có dữ liệu được gắn nhãn trước đó. Một hệ thống có thể được đào tạo trên các danh mục hiện có và sau đó sử dụng nhúng từ hoặc mô tả chủ đề để phân loại nội dung liên quan đến các sự kiện hoặc xu hướng không lường trước được.

ZSL so với các mô hình học tập liên quan

Điều quan trọng là phải phân biệt ZSL với các khái niệm liên quan:

  • Học theo phương pháp Few-Shot : Nhằm mục đích học các lớp mới từ một số lượng rất nhỏ các ví dụ được gắn nhãn (nhiều hơn 0).
  • Học một lần : Một trường hợp cụ thể của việc học ít lần, trong đó chỉ có một ví dụ được gắn nhãn cho mỗi lớp mới.
  • Chuyển giao học tập : Bao gồm việc tận dụng kiến thức thu được từ một nhiệm vụ hoặc miền để cải thiện hiệu suất trên một nhiệm vụ hoặc miền khác nhưng có liên quan. Thường bao gồm việc tinh chỉnh một mô hình được đào tạo trước trên dữ liệu mục tiêu, thường bao gồm các ví dụ về các lớp mục tiêu.

Điểm khác biệt chính là ZSL hoạt động theo điều kiện nghiêm ngặt là không có ví dụ nào được gắn nhãn cho các lớp mục tiêu trong quá trình đào tạo hoặc điều chỉnh. Để có cái nhìn tổng quan so sánh, hãy xem phần thảo luận về Hiểu về Few-Shot, Zero-Shot và Transfer Learning .

Tầm quan trọng trong AI

Zero-Shot Learning tăng cường đáng kể khả năng mở rộng và khả năng thích ứng của các hệ thống AI. Nó làm giảm sự phụ thuộc vào việc thu thập dữ liệu và chú thích đầy đủ, thường là nút thắt trong việc phát triển các ứng dụng ML quy mô lớn. Bằng cách cho phép các mô hình lý giải về các khái niệm chưa biết, ZSL mở rộng ranh giới của khái quát hóa trong Trí tuệ nhân tạo (AI) , giúp các hệ thống mạnh mẽ hơn và có khả năng xử lý bản chất mở của thế giới thực. Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạo và triển khai các mô hình, bao gồm cả những mô hình có khả năng tận dụng các nguyên tắc ZSL trong tương lai. Để biết thêm chi tiết về nghiên cứu ZSL, hãy tham khảo các nguồn như trang ZSL của Wikipedia hoặc các cuộc khảo sát học thuật được tìm thấy trên các nền tảng như arXiv .

Đọc tất cả