Thuật ngữ

Học tập chủ động

Khám phá phương pháp học chủ động, một phương pháp học máy tiết kiệm chi phí giúp tăng độ chính xác với ít nhãn hơn. Tìm hiểu cách phương pháp này chuyển đổi đào tạo AI!

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Học tập chủ động là một phương pháp chuyên biệt trong học máy, trong đó thuật toán đóng vai trò chủ động trong việc lựa chọn dữ liệu mà nó học. Không giống như học có giám sát truyền thống, dựa trên các tập dữ liệu được gắn nhãn hoàn toàn, học tập chủ động truy vấn thông minh các nhãn trên các điểm dữ liệu cụ thể mà nó cho là có nhiều thông tin nhất. Phương pháp có mục tiêu này cho phép mô hình đạt được độ chính xác cao với ít ví dụ được gắn nhãn hơn đáng kể, khiến nó trở thành một chiến lược hiệu quả và tiết kiệm chi phí để đào tạo các mô hình học máy, đặc biệt là khi xử lý các tập dữ liệu lớn không được gắn nhãn.

Học tập chủ động hoạt động như thế nào

Trong học tập chủ động, mô hình tương tác lặp đi lặp lại với một oracle (thường là một chú thích viên con người) để yêu cầu nhãn cho các điểm dữ liệu có giá trị nhất. Quá trình này thường tuân theo các bước sau:

  1. Đào tạo ban đầu: Mô hình ban đầu được đào tạo trên một tập dữ liệu được gắn nhãn nhỏ.
  2. Lấy mẫu không chắc chắn: Mô hình xác định các điểm dữ liệu mà nó không chắc chắn nhất về nhãn chính xác. Có nhiều chiến lược khác nhau để định lượng sự không chắc chắn, chẳng hạn như truy vấn các trường hợp có độ tin cậy dự đoán thấp nhất hoặc nơi các mô hình khác nhau trong một tập hợp không đồng nhất nhất.
  3. Truy vấn: Mô hình truy vấn oracle để lấy nhãn của các điểm dữ liệu đã chọn.
  4. Cập nhật mô hình: Dữ liệu được gắn nhãn mới sẽ được thêm vào bộ dữ liệu huấn luyện và mô hình sẽ được huấn luyện lại.
  5. Lặp lại: Các bước 2-4 được lặp lại cho đến khi đạt được mức độ chính xác mong muốn hoặc hết ngân sách dán nhãn.

Học tập chủ động đặc biệt hữu ích khi việc dán nhãn dữ liệu tốn kém, mất thời gian hoặc đòi hỏi chuyên môn đặc biệt. Bằng cách lựa chọn chiến lược các điểm dữ liệu cần dán nhãn, học tập chủ động giảm thiểu nỗ lực dán nhãn trong khi tối đa hóa hiệu suất của mô hình.

Lợi ích chính của việc học tập chủ động

Học tập chủ động mang lại một số lợi thế so với học tập có giám sát truyền thống:

  • Giảm chi phí dán nhãn: Bằng cách tập trung vào các điểm dữ liệu mang nhiều thông tin nhất, học tập chủ động giúp giảm đáng kể lượng dữ liệu được dán nhãn cần thiết để đào tạo một mô hình hiệu suất cao.
  • Đào tạo nhanh hơn: Với ít ví dụ được gắn nhãn cần thiết hơn, thời gian đào tạo có thể ngắn hơn đáng kể, đặc biệt là đối với các mô hình phức tạp.
  • Độ chính xác của mô hình được cải thiện: Học tập chủ động thường mang lại hiệu suất mô hình tốt hơn so với các mô hình được đào tạo trên dữ liệu được gắn nhãn được chọn ngẫu nhiên, vì nó ưu tiên các trường hợp mang tính thách thức và nhiều thông tin nhất.
  • Sử dụng hiệu quả tài nguyên: Học tập chủ động tối ưu hóa việc sử dụng tài nguyên bằng cách giảm thiểu công sức dành cho việc dán nhãn các điểm dữ liệu ít thông tin.

Ứng dụng thực tế của việc học tập chủ động

Học tập chủ động tìm thấy ứng dụng trên nhiều lĩnh vực khác nhau, nơi dữ liệu được gắn nhãn khan hiếm hoặc tốn kém để có được. Sau đây là hai ví dụ cụ thể:

Phân tích hình ảnh y tế

Trong phân tích hình ảnh y tế , việc lấy chú thích từ các chuyên gia y tế có thể tốn kém và mất thời gian. Học tập chủ động có thể được sử dụng để xác định các hình ảnh y tế quan trọng nhất cần được gắn nhãn chuyên gia, chẳng hạn như các hình ảnh có đặc điểm mơ hồ hoặc tình trạng hiếm gặp. Phương pháp tiếp cận có mục tiêu này cho phép phát triển các mô hình chẩn đoán chính xác với ít hình ảnh được gắn nhãn hơn, đẩy nhanh quá trình phát triển các công cụ y tế hỗ trợ AI.

Phát hiện đối tượng trong xe tự hành

Đào tạo các mô hình phát hiện vật thể cho xe tự hành đòi hỏi một lượng lớn dữ liệu được gắn nhãn đại diện cho các tình huống lái xe đa dạng. Học tập chủ động có thể giúp ưu tiên gắn nhãn các điểm dữ liệu khó khăn nhất đối với mô hình, chẳng hạn như điều kiện ánh sáng bất thường, vật thể bị che khuất hoặc tình huống giao thông hiếm gặp. Điều này đảm bảo rằng mô hình được đào tạo trên dữ liệu thông tin nhất, dẫn đến cải thiện tính an toàn và độ tin cậy trong các hệ thống lái xe tự hành. Đây chỉ là một trong nhiều ứng dụng của thị giác máy tính trong xe tự hành .

Học tập chủ động so với các mô hình học tập khác

Điều quan trọng là phải phân biệt học tập chủ động với các mô hình học tập liên quan khác:

  • Học có giám sát: Trong học có giám sát truyền thống, mô hình được đào tạo trên một tập dữ liệu cố định với nhãn đầy đủ. Ngược lại, học chủ động chọn động các điểm dữ liệu để dán nhãn trong quá trình đào tạo.
  • Học bán giám sát: Học bán giám sát sử dụng cả dữ liệu có nhãn và không có nhãn để đào tạo. Trong khi cả học chủ động và học bán giám sát đều hướng đến việc tận dụng dữ liệu không có nhãn, học chủ động chủ động truy vấn nhãn, trong khi học bán giám sát thường sử dụng dữ liệu không có nhãn để cải thiện khả năng hiểu của mô hình về phân phối dữ liệu cơ bản.
  • Học tăng cường: Học tăng cường liên quan đến việc một tác nhân học thông qua thử nghiệm và sai sót bằng cách tương tác với môi trường. Không giống như học chủ động, trong đó mô hình truy vấn một oracle để có nhãn, học tăng cường tập trung vào việc học các hành động tối ưu dựa trên phần thưởng và hình phạt.

Học tập chủ động và Ultralytics

Ultralytics cung cấp các giải pháp tiên tiến nhất để phát hiện đối tượng, bao gồm cả Ultralytics YOLO mô hình. Trong khi Ultralytics hiện không cung cấp hỗ trợ trực tiếp cho quy trình học tập tích cực, các đầu ra và hiểu biết được tạo ra bởi YOLO Các mô hình có thể được tận dụng để triển khai các chiến lược học tập chủ động. Ví dụ, điểm tin cậy của mô hình đối với việc phát hiện đối tượng có thể được sử dụng để xác định các trường hợp không chắc chắn để dán nhãn.

Ngoài ra, Ultralytics cung cấp một bộ công cụ và tài nguyên để đào tạo, xác thực và triển khai YOLO mô hình. Các công cụ này có thể được tích hợp vào các đường ống học tập chủ động tùy chỉnh để hợp lý hóa quá trình phát triển các hệ thống phát hiện đối tượng. Bạn có thể khám phá thêm các khả năng này trên trang tài liệu Ultralytics .

Học tập chủ động đại diện cho một mô hình mạnh mẽ để đào tạo các mô hình học máy hiệu quả, đặc biệt là khi dữ liệu được gắn nhãn khan hiếm hoặc đắt đỏ. Bằng cách lựa chọn thông minh các điểm dữ liệu thông tin nhất để gắn nhãn, học tập chủ động giúp giảm chi phí, đẩy nhanh quá trình đào tạo và cải thiện độ chính xác của mô hình. Khi nhu cầu về các giải pháp AI tăng lên trong nhiều ngành công nghiệp khác nhau, học tập chủ động được định vị để đóng vai trò ngày càng quan trọng trong việc phát triển các hệ thống học máy mạnh mẽ và hiệu quả.

Đọc tất cả