Khám phá Zero-Shot Learning: phương pháp AI tiên tiến cho phép các mô hình phân loại dữ liệu chưa thấy, cách mạng hóa phát hiện đối tượng, NLP, v.v.
Zero-Shot Learning (ZSL) đại diện cho một lĩnh vực hấp dẫn trong Machine Learning (ML) nơi một mô hình được đào tạo để nhận dạng và phân loại các danh mục dữ liệu mà nó chưa từng thấy rõ ràng trong giai đoạn đào tạo. Không giống như các phương pháp học có giám sát truyền thống yêu cầu các ví dụ được gắn nhãn cho mọi danh mục có thể, ZSL hướng đến việc khái quát hóa kiến thức từ các lớp đã thấy sang các lớp chưa thấy bằng cách sử dụng thông tin phụ trợ được chia sẻ. Khả năng này đặc biệt có giá trị trong các tình huống thực tế khi việc thu thập dữ liệu được gắn nhãn cho mọi danh mục có thể hình dung được là không thực tế hoặc không thể.
Ý tưởng cốt lõi đằng sau ZSL là tìm hiểu ánh xạ giữa không gian đặc điểm đầu vào (ví dụ: đặc điểm hình ảnh hoặc đặc điểm văn bản) và không gian nhúng ngữ nghĩa. Không gian ngữ nghĩa này thường mã hóa các thuộc tính hoặc đặc điểm mô tả cấp cao được chia sẻ giữa cả lớp nhìn thấy và lớp không nhìn thấy. Ví dụ, trong thị giác máy tính , chúng có thể là các thuộc tính trực quan như 'có sọc', 'có lông', 'có cánh' hoặc mô tả dựa trên văn bản. Trong Xử lý ngôn ngữ tự nhiên (NLP) , nhúng từ thường đóng vai trò là không gian ngữ nghĩa này.
Trong quá trình đào tạo, mô hình học cách liên kết các tính năng của các lớp đã thấy với các biểu diễn ngữ nghĩa tương ứng của chúng (ví dụ: thuộc tính hoặc nhúng). Tại thời điểm suy luận, khi được trình bày với một trường hợp của một lớp chưa thấy, mô hình sẽ trích xuất các tính năng của nó và ánh xạ chúng vào không gian ngữ nghĩa đã học. Bằng cách so sánh ánh xạ này với các biểu diễn ngữ nghĩa đã biết của các lớp chưa thấy (được cung cấp riêng), mô hình có thể dự đoán nhãn lớp ngay cả khi không có ví dụ trước đó. Các mô hình Học sâu , đặc biệt là các mô hình sử dụng các kỹ thuật như học tương phản như CLIP , thường được sử dụng cho các tác vụ ZSL do khả năng học các biểu diễn tính năng phong phú của chúng. Bạn có thể khám phá nhiều tập dữ liệu khác nhau phù hợp cho các tác vụ như vậy, như những tập dữ liệu được liệt kê trong tài liệu Bộ dữ liệu Ultralytics .
Zero-Shot Learning cho phép áp dụng mạnh mẽ trên nhiều lĩnh vực khác nhau:
Điều quan trọng là phải phân biệt ZSL với các khái niệm liên quan:
Điểm khác biệt chính là ZSL hoạt động theo điều kiện nghiêm ngặt là không có ví dụ nào được gắn nhãn cho các lớp mục tiêu trong quá trình đào tạo hoặc điều chỉnh. Để có cái nhìn tổng quan so sánh, hãy xem phần thảo luận về Hiểu về Few-Shot, Zero-Shot và Transfer Learning .
Zero-Shot Learning tăng cường đáng kể khả năng mở rộng và khả năng thích ứng của các hệ thống AI. Nó làm giảm sự phụ thuộc vào việc thu thập dữ liệu và chú thích đầy đủ, thường là nút thắt trong việc phát triển các ứng dụng ML quy mô lớn. Bằng cách cho phép các mô hình lý giải về các khái niệm chưa biết, ZSL mở rộng ranh giới của khái quát hóa trong Trí tuệ nhân tạo (AI) , giúp các hệ thống mạnh mẽ hơn và có khả năng xử lý bản chất mở của thế giới thực. Các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc đào tạo và triển khai các mô hình, bao gồm cả những mô hình có khả năng tận dụng các nguyên tắc ZSL trong tương lai. Để biết thêm chi tiết về nghiên cứu ZSL, hãy tham khảo các nguồn như trang ZSL của Wikipedia hoặc các cuộc khảo sát học thuật được tìm thấy trên các nền tảng như arXiv .