Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học bán giám sát

Khám phá cách học bán giám sát kết hợp dữ liệu được gắn nhãn và không được gắn nhãn để nâng cao độ chính xác của mô hình. Tìm hiểu cách triển khai quy trình làm việc SSL bằng cách sử dụng Ultralytics YOLO26.

Học bán giám sát (SSL) là một mô hình chiến lược trong học máy (ML) đóng vai trò cầu nối giữa hai phương pháp huấn luyện truyền thống. Trong khi học giám sát hoàn toàn dựa vào các tập dữ liệu được chú thích đầy đủ và học không giám sát cố gắng tìm ra các mẫu trong dữ liệu mà không cần bất kỳ nhãn nào, SSL hoạt động bằng cách kết hợp một lượng nhỏ dữ liệu được gắn nhãn với một lượng lớn dữ liệu chưa được gắn nhãn . Cách tiếp cận này đặc biệt có giá trị trong các kịch bản thị giác máy tính (CV) thực tế, nơi việc thu thập hình ảnh thô—chẳng hạn như cảnh quay video từ camera an ninh hoặc vệ tinh—tương đối rẻ, nhưng quá trình gắn nhãn dữ liệu bởi các chuyên gia lại tốn kém, chậm và tốn nhiều công sức. Bằng cách sử dụng hiệu quả cấu trúc ẩn bên trong các ví dụ chưa được gắn nhãn, SSL có thể cải thiện đáng kể độ chính xác và khả năng khái quát hóa của mô hình mà không cần ngân sách chú thích quá lớn.

Các cơ chế cốt lõi của học bán giám sát

Mục tiêu chính của SSL là truyền tải thông tin tìm thấy trong tập hợp nhỏ các ví dụ đã được gán nhãn đến tập hợp lớn hơn các ví dụ chưa được gán nhãn. Điều này cho phép mạng nơ-ron học được các ranh giới quyết định đi qua các vùng có mật độ dữ liệu thấp, dẫn đến phân loại hoặc phát hiện mạnh mẽ hơn.

Hai kỹ thuật phổ biến chi phối hầu hết các quy trình làm việc bán giám sát:

  • Gán nhãn giả: Trong phương pháp này, mô hình được huấn luyện trước trên dữ liệu được gán nhãn hạn chế. Sau đó, nó được sử dụng để chạy suy luận trên dữ liệu chưa được gán nhãn. Các dự đoán vượt quá ngưỡng độ tin cậy cụ thể được coi là "nhãn giả" hoặc dữ liệu thực tế . Những dự đoán đáng tin cậy này được thêm vào dữ liệu huấn luyện , và mô hình được huấn luyện lại, cải thiện hiệu suất một cách lặp đi lặp lại.
  • Chuẩn hóa tính nhất quán: Kỹ thuật này dựa trên việc tăng cường dữ liệu . Ý tưởng là mô hình nên đưa ra các dự đoán tương tự cho một hình ảnh và một phiên bản được sửa đổi nhẹ (tăng cường) của cùng hình ảnh đó. Bằng cách giảm thiểu sự khác biệt trong dự đoán giữa phiên bản gốc và phiên bản được tăng cường, mô hình học cách tập trung vào các đặc điểm cốt lõi của đối tượng thay vì nhiễu, cải thiện khả năng xử lý hiện tượng quá khớp .

Ứng dụng thực tiễn với YOLO

Sau đây Python Ví dụ này minh họa quy trình gán nhãn giả đơn giản bằng cách sử dụng gói ultralytics . Ở đây, chúng ta huấn luyện mô hình YOLO26 trên một tập dữ liệu nhỏ và sau đó sử dụng nó để tạo nhãn cho một thư mục hình ảnh chưa được gán nhãn.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)

# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)

Các Ứng dụng Thực tế

Học bán giám sát đang làm thay đổi các ngành công nghiệp nơi dữ liệu dồi dào nhưng chuyên môn lại khan hiếm.

  • Hình ảnh y tế: Trong lĩnh vực trí tuệ nhân tạo y tế , việc thu thập hình ảnh quét (tia X, MRI) là quy trình tiêu chuẩn, nhưng việc thuê bác sĩ chuyên khoa X quang chú thích từng pixel để phát hiện khối u lại vô cùng tốn kém. SSL cho phép các nhà nghiên cứu huấn luyện các mô hình hiệu năng cao chỉ bằng một phần nhỏ các trường hợp được chuyên gia chú thích, tận dụng hàng ngàn hình ảnh quét được lưu trữ để tinh chỉnh sự hiểu biết của mô hình về các cấu trúc sinh học.
  • Lái xe tự động: Các công ty sản xuất xe tự lái thu thập hàng petabyte dữ liệu video mỗi ngày từ các phương tiện trong đội xe. Việc gắn nhãn cho từng khung hình để phát hiện đối tượngphân đoạn ngữ nghĩa là điều không thể. Thông qua SSL, hệ thống có thể học hỏi từ phần lớn thời gian lái xe chưa được gắn nhãn để hiểu rõ hơn về môi trường đường xá phức tạp, điều kiện thời tiết và các trường hợp ngoại lệ hiếm gặp.

Phân biệt các khái niệm liên quan

Để triển khai các giải pháp AI một cách hiệu quả, điều quan trọng là phải hiểu SSL khác biệt như thế nào so với các chiến lược tương tự:

  • So với Học chủ động : Mặc dù cả hai đều xử lý dữ liệu chưa được gắn nhãn, nhưng cách tiếp cận việc gắn nhãn của chúng lại khác nhau. Học bán dẫn tự động (SSL) tự động gán nhãn dựa trên dự đoán của mô hình. Ngược lại, học chủ động xác định các điểm dữ liệu "gây nhầm lẫn" hoặc không chắc chắn nhất và yêu cầu con người tham gia vào quá trình gắn nhãn, tối ưu hóa thời gian của con người thay vì loại bỏ hoàn toàn các điểm dữ liệu đó.
  • So sánh với Học chuyển giao (Transfer Learning ): Học chuyển giao liên quan đến việc lấy một mô hình đã được huấn luyện trước trên một tập dữ liệu bên ngoài khổng lồ (như ImageNet ) và tinh chỉnh nó cho nhiệm vụ cụ thể của bạn. Tuy nhiên, SSL tập trung vào việc tận dụng phần dữ liệu chưa được gắn nhãn của phân phối dữ liệu cụ thể của bạn trong chính quá trình huấn luyện.
  • So với Học Tự Giám Sát (Self-Supervised Learning - SSL): Mặc dù tên gọi tương tự, học tự giám sát thường đề cập đến "các nhiệm vụ giả định" (như giải một bức tranh ghép hình gồm các mảng ảnh) trong đó dữ liệu tự tạo ra các tín hiệu giám sát mà không cần bất kỳ nhãn bên ngoài nào. SSL đặc biệt ám chỉ việc sử dụng một tập hợp nhỏ hơn các nhãn đã được xác thực để hướng dẫn quá trình.

Công cụ và triển vọng tương lai

Khi các mô hình học sâu (DL) ngày càng lớn, hiệu quả sử dụng dữ liệu trở nên tối quan trọng. Các framework hiện đại như PyTorchTensorFlow cung cấp nền tảng tính toán cho các vòng lặp huấn luyện nâng cao này. Hơn nữa, các công cụ như Ultralytics Platform đang đơn giản hóa vòng đời quản lý tập dữ liệu. Bằng cách sử dụng các tính năng như tự động chú thích , các nhóm có thể dễ dàng triển khai các quy trình bán giám sát, nhanh chóng chuyển đổi dữ liệu thô thành trọng số mô hình sẵn sàng cho sản xuất. Sự phát triển này trong MLOps đảm bảo rằng rào cản gia nhập để tạo ra các hệ thống thị giác có độ chính xác cao tiếp tục giảm.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay