Mở khóa sức mạnh của việc học chuyển giao để tiết kiệm thời gian, tăng cường hiệu suất AI và giải quyết các nhiệm vụ mới với dữ liệu hạn chế bằng cách sử dụng các mô hình được đào tạo trước.
Học chuyển giao là một kỹ thuật mạnh mẽ trong học máy cho phép các mô hình áp dụng kiến thức thu được từ việc giải quyết một vấn đề cho một vấn đề khác nhưng có liên quan. Thay vì đào tạo một mô hình từ đầu mỗi lần, học chuyển giao tận dụng các mô hình được đào tạo trước, tiết kiệm thời gian, tài nguyên và thường cải thiện hiệu suất, đặc biệt là khi dữ liệu bị hạn chế cho nhiệm vụ mới. Phương pháp tiếp cận này được sử dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là trong thị giác máy tính và xử lý ngôn ngữ tự nhiên, để xây dựng các hệ thống AI hiệu quả và hiệu suất hơn.
Ý tưởng cốt lõi đằng sau việc học chuyển giao là sử dụng các tính năng mà một mô hình học được trên một tập dữ liệu lớn cho một tập dữ liệu mới, thường nhỏ hơn. Thông thường, một mô hình đầu tiên được đào tạo trên một tập dữ liệu lớn như ImageNet cho một tác vụ chung, chẳng hạn như phân loại hình ảnh. Giai đoạn đào tạo trước này cho phép mô hình học các tính năng và mẫu cơ bản từ dữ liệu. Sau đó, đối với một tác vụ mới có liên quan, các trọng số của mô hình được đào tạo trước được sử dụng làm điểm khởi đầu. Giai đoạn thứ hai này, thường được gọi là tinh chỉnh, bao gồm việc đào tạo mô hình thêm trên tập dữ liệu mới, cụ thể cho tác vụ. Thông thường, chỉ các lớp cuối cùng của mô hình được đào tạo lại, trong khi các lớp trước đó, đã học được các tính năng chung, được giữ nguyên hoặc được đào tạo với tốc độ học thấp hơn.
Phương pháp này đặc biệt hiệu quả vì các lớp ban đầu của mạng nơ-ron sâu có xu hướng học các đặc điểm chung (ví dụ: cạnh, kết cấu trong hình ảnh), thường có thể chuyển giao giữa các tác vụ khác nhau nhưng có liên quan. Bằng cách sử dụng lại các đặc điểm đã học này, việc học chuyển giao làm giảm nhu cầu về dữ liệu và tài nguyên tính toán mở rộng cho mỗi vấn đề mới.
Học chuyển giao được áp dụng trên nhiều lĩnh vực. Sau đây là một vài ví dụ cụ thể:
Phân tích hình ảnh y tế : Trong phân tích hình ảnh y tế , các tập dữ liệu cho các bệnh cụ thể có thể nhỏ và khó thu thập. Học chuyển giao cho phép các mô hình được đào tạo trước trên các tập dữ liệu hình ảnh chung được tinh chỉnh hiệu quả cho các tác vụ như phát hiện khối u trong tia X hoặc phân đoạn các cơ quan trong quét MRI. Điều này rất quan trọng để cải thiện độ chính xác và hiệu quả chẩn đoán, như được nêu bật trong các ứng dụng của AI trong chăm sóc sức khỏe .
Phát hiện đối tượng trong các miền cụ thể : Trong khi các tập dữ liệu lớn tồn tại để phát hiện đối tượng chung, các ứng dụng chuyên biệt thường yêu cầu các mô hình để phát hiện các đối tượng cụ thể trong các bối cảnh duy nhất. Ví dụ, trong thị giác máy tính trong nông nghiệp , một mô hình được đào tạo trước trên một tập dữ liệu phát hiện đối tượng rộng có thể được tinh chỉnh để phát hiện các loại cây trồng hoặc sâu bệnh cụ thể trong hình ảnh nông nghiệp. Cách tiếp cận này đặc biệt phù hợp trong các ứng dụng như canh tác chính xác , nơi việc thu thập dữ liệu có thể là thách thức và chuyên môn cụ thể về lĩnh vực là rất quan trọng. Ultralytics YOLO các mô hình như YOLOv8 và YOLOv11 thường được sử dụng với phương pháp học chuyển giao cho nhiều tác vụ phát hiện đối tượng khác nhau, tận dụng trọng số được đào tạo trước và khả năng tinh chỉnh.
Các mô hình YOLO Ultralytics được thiết kế để dễ dàng thích ứng thông qua việc học chuyển giao. Người dùng có thể dễ dàng tận dụng các trọng số được đào tạo trước có sẵn trong Ultralytics HUB cho các mô hình như YOLOv5 , YOLOv8 và YOLOv11. Bằng cách tinh chỉnh các mô hình được đào tạo trước này trên các tập dữ liệu tùy chỉnh, người dùng có thể nhanh chóng đạt được hiệu suất cao trong các tác vụ phát hiện, phân đoạn hoặc phân loại đối tượng cụ thể của họ. Tính năng Ultralytics HUB Cloud Training đơn giản hóa hơn nữa quy trình này, cho phép người dùng đào tạo và tinh chỉnh các mô hình trong môi trường đám mây mà không cần thiết lập mở rộng. Các kỹ thuật như tinh chỉnh siêu tham số cũng có thể được áp dụng trong quá trình tinh chỉnh để tối ưu hóa hơn nữa hiệu suất của mô hình cho tác vụ cụ thể.
Học chuyển giao là nền tảng của học máy hiện đại, tác động đáng kể đến hiệu quả và hiệu suất của quá trình phát triển mô hình AI. Bằng cách tái sử dụng kiến thức từ các mô hình được đào tạo trước, nó dân chủ hóa AI, khiến AI dễ tiếp cận và thiết thực hơn cho nhiều ứng dụng hơn, đặc biệt là trong các tình huống có dữ liệu hoặc tài nguyên tính toán hạn chế. Khả năng tăng tốc quá trình phát triển và cải thiện hiệu suất mô hình khiến nó trở thành một công cụ không thể thiếu trong bối cảnh AI.