Thuật ngữ

Học bán giám sát

Khám phá cách Học bán giám sát kết hợp dữ liệu có nhãn và không có nhãn để cải thiện mô hình AI, giảm chi phí gắn nhãn và tăng độ chính xác.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Học bán giám sát (SSL) là một giải pháp trung gian mạnh mẽ trong Học máy (ML) , kết hợp một lượng nhỏ dữ liệu được gắn nhãn với một lượng lớn dữ liệu không được gắn nhãn trong quá trình đào tạo. Cách tiếp cận này đặc biệt có giá trị trong các tình huống mà việc thu thập dữ liệu được gắn nhãn tốn kém, mất thời gian hoặc không thực tế, nhưng dữ liệu không được gắn nhãn lại rất nhiều. SSL hướng đến việc tận dụng cấu trúc cơ bản trong dữ liệu không được gắn nhãn để cải thiện hiệu suất mô hình vượt xa những gì có thể đạt được khi chỉ sử dụng dữ liệu được gắn nhãn hạn chế, khiến nó trở thành một kỹ thuật thực tế cho nhiều vấn đề Trí tuệ nhân tạo (AI) trong thế giới thực.

Học bán giám sát hoạt động như thế nào

Thuật toán SSL hoạt động bằng cách đưa ra một số giả định về mối quan hệ giữa dữ liệu được gắn nhãn và không được gắn nhãn. Các giả định phổ biến bao gồm 'giả định về độ mịn' (các điểm gần nhau có khả năng chia sẻ một nhãn) hoặc 'giả định cụm' (dữ liệu có xu hướng tạo thành các cụm riêng biệt và các điểm trong cùng một cụm có khả năng chia sẻ một nhãn). Các kỹ thuật thường bao gồm việc đào tạo một mô hình ban đầu trên dữ liệu được gắn nhãn và sau đó sử dụng nó để tạo nhãn giả cho dữ liệu không được gắn nhãn dựa trên các dự đoán có độ tin cậy cao. Sau đó, mô hình được đào tạo lại trên cả dữ liệu được gắn nhãn ban đầu và dữ liệu được gắn nhãn giả mới. Một cách tiếp cận khác là chính quy hóa tính nhất quán, trong đó mô hình được khuyến khích tạo ra cùng một đầu ra cho một ví dụ không được gắn nhãn ngay cả khi đầu vào của nó bị nhiễu nhẹ, thường đạt được thông qua việc tăng cường dữ liệu . Các phương pháp này cho phép mô hình học hỏi từ các mẫu và phân phối vốn có trong nhóm lớn các mẫu không được gắn nhãn. Các kỹ thuật nâng cao hơn được khám phá trong các tài nguyên như các bài đăng trên Blog AI Google về SSL .

So sánh với các mô hình học tập khác

Học bán giám sát chiếm một vị trí độc đáo giữa các loại hình học tập chính khác:

  • Học có giám sát : Hoàn toàn dựa vào dữ liệu đào tạo được gắn nhãn. SSL khác biệt ở chỗ kết hợp dữ liệu không được gắn nhãn để có khả năng cải thiện hiệu suất khi dữ liệu được gắn nhãn khan hiếm.
  • Học không giám sát : Chỉ sử dụng dữ liệu không có nhãn để tìm các mẫu hoặc cấu trúc, như phân cụm hoặc giảm chiều . SSL sử dụng dữ liệu không có nhãn nhưng hướng dẫn quá trình học bằng một tập hợp nhỏ các ví dụ có nhãn để thực hiện các tác vụ như phân loại hoặc hồi quy.
  • Học tự giám sát (SSL) : Một loại học không giám sát trong đó các nhãn được tự động tạo ra từ chính dữ liệu đầu vào (ví dụ: dự đoán một phần được che của hình ảnh). Mặc dù sử dụng dữ liệu không được gắn nhãn, cơ chế tạo ra sự giám sát của nó khác với các phương pháp bán giám sát thông thường kết hợp rõ ràng dữ liệu được gắn nhãn trước và không được gắn nhãn.

Ứng dụng trong thế giới thực

SSL có hiệu quả cao trong các lĩnh vực mà việc gắn nhãn là một trở ngại:

  1. Phân loại trang web: Có thể dán nhãn thủ công một số lượng nhỏ các trang web (ví dụ: 'thể thao', 'tin tức', 'công nghệ'), nhưng không thực tế khi dán nhãn hàng tỷ trang web. SSL có thể sử dụng số lượng lớn các trang web chưa được dán nhãn để cải thiện độ chính xác và độ mạnh mẽ của trình phân loại, học hỏi từ nội dung văn bản và cấu trúc liên kết ( tổng quan về khai thác nội dung web ).
  2. Nhận dạng giọng nói : Việc phiên âm âm thanh đòi hỏi nỗ lực đáng kể của con người. SSL cho phép các hệ thống đào tạo trên một lượng nhỏ âm thanh đã phiên âm cùng với khối lượng lớn dữ liệu âm thanh chưa phiên âm, cải thiện khả năng nhận dạng nhiều giọng và phong cách nói khác nhau ( nghiên cứu xử lý giọng nói ).
  3. Phân tích hình ảnh y tế : Việc chú thích chuyên gia về các lần quét y tế (như chụp MRI hoặc chụp CT để phát hiện khối u ) rất tốn kém và đòi hỏi kiến thức chuyên môn. SSL có thể tận dụng nhiều lần quét không có nhãn để nâng cao hiệu suất của các mô hình chẩn đoán được đào tạo trên một tập hợp giới hạn các hình ảnh có chú thích, có khả năng dẫn đến các giải pháp AI tốt hơn trong chăm sóc sức khỏe .
  4. Phát hiện đối tượng trong thị giác máy tính (CV) : Việc tạo các hộp giới hạn chính xác cho các đối tượng trong hàng nghìn hình ảnh là công việc tốn nhiều công sức ( hướng dẫn thu thập và chú thích dữ liệu ). Các kỹ thuật SSL có thể sử dụng nhiều hình ảnh hoặc khung video không có nhãn cùng với một tập dữ liệu có nhãn nhỏ hơn để cải thiện hiệu suất phát hiện cho các mô hình như Ultralytics YOLO .

Ưu điểm và thách thức

Ưu điểm chính của SSL là khả năng giảm sự phụ thuộc vào các tập dữ liệu có nhãn lớn, tiết kiệm thời gian và tài nguyên liên quan đến việc gắn nhãn dữ liệu . Nó thường dẫn đến việc khái quát hóa mô hình tốt hơn so với các mô hình chỉ được giám sát được đào tạo trên dữ liệu hạn chế bằng cách khai thác thông tin từ các mẫu không có nhãn. Tuy nhiên, sự thành công của SSL phụ thuộc rất nhiều vào các giả định cơ bản về tính chính xác của dữ liệu. Nếu các giả định này không đúng (ví dụ: phân phối dữ liệu không có nhãn rất khác so với dữ liệu có nhãn), các phương pháp SSL thậm chí có thể làm giảm hiệu suất. Việc lựa chọn và triển khai cẩn thận các kỹ thuật SSL là rất quan trọng, thường đòi hỏi chuyên môn về các hoạt động MLOps .

Công cụ và đào tạo

Nhiều khuôn khổ Học sâu (DL) hiện đại, bao gồm PyTorch ( trang web chính thức của PyTorch ) và TensorFlow ( trang web chính thức TensorFlow ), cung cấp các chức năng hoặc có thể được điều chỉnh để triển khai các thuật toán SSL. Các thư viện như Scikit-learn cung cấp một số phương pháp SSL . Các nền tảng như Ultralytics HUB hợp lý hóa quy trình bằng cách tạo điều kiện thuận lợi cho việc quản lý các tập dữ liệu ( tài liệu Bộ dữ liệu Ultralytics HUB ) có thể chứa hỗn hợp dữ liệu được gắn nhãn và không được gắn nhãn, đơn giản hóa việc đào tạo ( Đào tạo đám mây Ultralytics HUB ) và triển khai ( hướng dẫn tùy chọn triển khai mô hình ) của các mô hình được thiết kế để tận dụng các cấu trúc dữ liệu như vậy. Nghiên cứu về SSL tiếp tục phát triển, với những đóng góp thường được trình bày tại các hội nghị AI lớn như NeurIPSICML .

Đọc tất cả