Học chuyển giao là một kỹ thuật mạnh mẽ trong học máy (ML), trong đó một mô hình được phát triển cho một tác vụ được sử dụng lại làm điểm khởi đầu cho một mô hình trên tác vụ thứ hai có liên quan. Phương pháp này tận dụng kiến thức thu được từ tác vụ ban đầu để cải thiện hiệu quả học tập và hiệu suất trên tác vụ mới, đặc biệt là khi tác vụ mới có dữ liệu hạn chế. Thay vì đào tạo một mô hình từ đầu, học chuyển giao cho phép bạn tận dụng các mô hình được đào tạo trước đã được phát triển trên các tập dữ liệu lớn, giúp tiết kiệm đáng kể thời gian và tài nguyên tính toán.
Học chuyển giao hoạt động như thế nào
Ý tưởng cốt lõi đằng sau việc học chuyển giao là một mô hình đã học cách nhận dạng các mẫu trong một tập dữ liệu lớn có thể chuyển kiến thức đó sang một nhiệm vụ khác nhưng có liên quan. Ví dụ, một mô hình được đào tạo để nhận dạng các đối tượng trong hàng triệu hình ảnh có thể được điều chỉnh để nhận dạng các loại đối tượng cụ thể với một tập dữ liệu nhỏ hơn. Điều này đặc biệt hữu ích trong thị giác máy tính (CV) và xử lý ngôn ngữ tự nhiên (NLP) , trong đó việc tạo các tập dữ liệu lớn có gắn nhãn có thể tốn thời gian và tốn kém.
Các loại hình học chuyển giao
Có một số cách tiếp cận để chuyển giao việc học, bao gồm:
- Trích xuất tính năng: Trong phương pháp này, mô hình được đào tạo trước được sử dụng như một trình trích xuất tính năng cố định. Các lớp cuối cùng của mô hình, thường là các lớp cụ thể cho từng tác vụ, được loại bỏ và đầu ra của các lớp còn lại được sử dụng làm đầu vào cho một bộ phân loại mới.
- Tinh chỉnh: Điều này liên quan đến việc giải phóng một số hoặc tất cả các lớp của mô hình được đào tạo trước và tiếp tục quá trình đào tạo trên tập dữ liệu mới. Điều này cho phép mô hình điều chỉnh các tính năng đã học của nó theo các chi tiết cụ thể của nhiệm vụ mới trong khi vẫn giữ nguyên kiến thức chung thu được từ nhiệm vụ ban đầu. Khám phá tinh chỉnh chi tiết để hiểu cách nó tăng cường độ chính xác của mô hình.
Lợi ích của việc học chuyển giao
Học chuyển giao mang lại một số lợi thế:
- Giảm thời gian đào tạo: Bằng cách bắt đầu với một mô hình được đào tạo trước, thời gian đào tạo cho nhiệm vụ mới sẽ được giảm đáng kể.
- Cải thiện hiệu suất: Tận dụng kiến thức từ một nhiệm vụ liên quan thường mang lại hiệu suất tốt hơn, đặc biệt là khi nhiệm vụ mới có dữ liệu hạn chế.
- Ít dữ liệu cần thiết: Học chuyển giao có thể đặc biệt hiệu quả khi bạn có một tập dữ liệu nhỏ cho nhiệm vụ mới, vì mô hình được đào tạo trước đã hiểu rõ các mẫu cơ bản.
Chuyển giao học tập so với các kỹ thuật học tập khác
Điều quan trọng là phải phân biệt phương pháp học chuyển giao với các kỹ thuật học tập liên quan khác:
- Học chuyển giao so với Học có giám sát: Trong học có giám sát truyền thống, một mô hình được đào tạo từ đầu trên một tập dữ liệu được gắn nhãn cụ thể cho nhiệm vụ đang thực hiện. Mặt khác, học chuyển giao tận dụng một mô hình được đào tạo trước làm điểm khởi đầu, có thể giảm đáng kể lượng dữ liệu được gắn nhãn và thời gian đào tạo cần thiết.
- Chuyển giao học tập so với tinh chỉnh : Mặc dù tinh chỉnh là một loại chuyển giao học tập cụ thể, nhưng không phải tất cả chuyển giao học tập đều liên quan đến tinh chỉnh. Ví dụ, sử dụng một mô hình được đào tạo trước làm trình trích xuất tính năng cố định là một hình thức chuyển giao học tập không liên quan đến tinh chỉnh.
Ứng dụng trong thế giới thực
Học chuyển giao có nhiều ứng dụng thực tế trong nhiều lĩnh vực khác nhau:
- Chụp ảnh y tế: Trong chăm sóc sức khỏe, học chuyển giao có thể được sử dụng để điều chỉnh các mô hình được đào tạo trên các tập dữ liệu lớn về hình ảnh chung thành các tác vụ chụp ảnh y tế cụ thể, chẳng hạn như phát hiện khối u hoặc các bất thường khác trong chụp X-quang, MRI hoặc CT. Điều này đặc biệt có giá trị vì các tập dữ liệu chụp ảnh y tế thường nhỏ hơn và khó thu thập hơn do lo ngại về quyền riêng tư và nhu cầu dán nhãn chuyên gia. Khám phá AI trong chăm sóc sức khỏe để biết thêm thông tin chi tiết.
- Phát hiện đối tượng trong xe tự hành: Học chuyển giao đóng vai trò quan trọng trong việc đào tạo các mô hình phát hiện đối tượng trong xe tự lái. Một mô hình được đào tạo trước trên một tập dữ liệu lớn gồm các hình ảnh chung có thể được tinh chỉnh để nhận dạng các đối tượng cụ thể liên quan đến việc lái xe, chẳng hạn như người đi bộ, phương tiện và biển báo giao thông, bằng cách sử dụng một tập dữ liệu nhỏ hơn, chuyên biệt. Tìm hiểu thêm về AI trong xe tự lái .
Công cụ và Khung
Một số khuôn khổ học sâu phổ biến hỗ trợ học chuyển giao, bao gồm PyTorch và TensorFlow . Các khuôn khổ này cung cấp quyền truy cập vào nhiều mô hình được đào tạo trước, chẳng hạn như các mô hình có sẵn trong thư viện Hugging Face Transformers , có thể dễ dàng điều chỉnh cho các tác vụ mới. Ngoài ra, các nền tảng như Ultralytics HUB tạo điều kiện thuận lợi cho việc sử dụng được đào tạo trước Ultralytics YOLO mô hình, đơn giản hóa quá trình triển khai học chuyển giao cho các ứng dụng thị giác máy tính.
Bằng cách tận dụng sức mạnh của việc học chuyển giao, các nhà phát triển và nhà nghiên cứu có thể tạo ra các mô hình hiệu suất cao hiệu quả hơn, ngay cả với dữ liệu hạn chế, qua đó đẩy nhanh quá trình phát triển và triển khai các giải pháp AI trên nhiều ngành công nghiệp khác nhau.