Học máy tự động (AutoML) đề cập đến quá trình tự động hóa các tác vụ lặp đi lặp lại tốn thời gian liên quan đến việc phát triển các mô hình Học máy (ML) . Nó nhằm mục đích làm cho các kỹ thuật ML dễ tiếp cận hơn đối với những cá nhân có thể không phải là chuyên gia trong lĩnh vực này (như nhà khoa học dữ liệu) và đẩy nhanh quá trình phát triển cho những người hành nghề có kinh nghiệm. Các công cụ và nền tảng AutoML tự động hóa các giai đoạn khác nhau của quy trình ML, cho phép người dùng xây dựng các mô hình chất lượng cao với sự can thiệp thủ công tối thiểu.
Các tác vụ tự động chính trong AutoML
Hệ thống AutoML thường tự động hóa một số bước quan trọng trong quy trình học máy:
- Tiền xử lý dữ liệu: Xử lý các giá trị bị thiếu, tính năng tỷ lệ và thực hiện các chuyển đổi cần thiết trên dữ liệu đào tạo . Điều này đảm bảo dữ liệu phù hợp để đào tạo mô hình. Các kỹ thuật như chuẩn hóa thường được tự động hóa.
- Kỹ thuật tính năng: Tự động tạo các tính năng mới từ các tính năng hiện có hoặc chọn các tính năng phù hợp nhất để cải thiện hiệu suất mô hình. Điều này có thể liên quan đến các kỹ thuật được đề cập trong các khái niệm kỹ thuật tính năng .
- Lựa chọn mô hình: Chọn thuật toán tốt nhất (ví dụ: cây quyết định, mạng nơ-ron như Ultralytics YOLO hoặc máy vectơ hỗ trợ) cho một tác vụ và tập dữ liệu nhất định. Các nền tảng AutoML thường khám phá nhiều kiến trúc phát hiện đối tượng hoặc mô hình phân loại khác nhau.
- Điều chỉnh siêu tham số: Tối ưu hóa cài đặt cấu hình (siêu tham số) của mô hình đã chọn để đạt được hiệu suất tốt nhất. Đây là bước quan trọng được trình bày chi tiết trong hướng dẫn về điều chỉnh siêu tham số .
Lợi ích của AutoML
Sử dụng AutoML mang lại một số lợi thế:
- Tăng hiệu quả: Tự động hóa các tác vụ lặp đi lặp lại, giảm đáng kể thời gian cần thiết để phát triển và triển khai các mô hình ML.
- Cải thiện khả năng truy cập: Cho phép các chuyên gia và nhà phát triển có ít chuyên môn về ML tận dụng các kỹ thuật mô hình hóa mạnh mẽ.
- Hiệu suất nâng cao: Có thể khám phá nhiều mô hình và siêu tham số hơn so với các phương pháp thủ công, có khả năng dẫn đến các mô hình chính xác và mạnh mẽ hơn. Các nền tảng như Ultralytics HUB đơn giản hóa quy trình đào tạo, góp phần vào hiệu quả này.
- Giảm thiểu sự thiên vị: Tự động hóa có thể giúp giảm thiểu sự thiên vị của con người trong việc lựa chọn và điều chỉnh mô hình AI , mặc dù vẫn cần phải giám sát cẩn thận.
Ứng dụng trong thế giới thực
AutoML được áp dụng trong nhiều ngành công nghiệp khác nhau:
- Phát hiện gian lận: Các tổ chức tài chính sử dụng AutoML để nhanh chóng xây dựng và cập nhật các mô hình phát hiện giao dịch gian lận bằng cách tự động kiểm tra các thuật toán và tính năng khác nhau trên dữ liệu giao dịch. Điều này cải thiện tỷ lệ phát hiện và thích ứng với các mô hình gian lận mới nhanh hơn so với mô hình thủ công.
- Phân tích hình ảnh y tế: Trong chăm sóc sức khỏe, AutoML hỗ trợ phát triển các mô hình cho các nhiệm vụ như phân tích hình ảnh y tế , chẳng hạn như xác định khối u hoặc bất thường trong X-quang hoặc MRI. AutoML có thể tối ưu hóa các mô hình học sâu phức tạp để có độ chính xác cao.
Công cụ và nền tảng AutoML
Một số công cụ và nền tảng cung cấp khả năng AutoML:
AutoML so với MLOps
Trong khi AutoML tập trung vào việc tự động hóa quy trình xây dựng mô hình (lựa chọn, đào tạo, điều chỉnh), thì Machine Learning Operations (MLOps) bao gồm toàn bộ vòng đời của mô hình ML, bao gồm triển khai, giám sát, quản lý và quản trị. AutoML có thể được coi là một thành phần trong chiến lược MLOps rộng hơn, hợp lý hóa giai đoạn tạo mô hình ban đầu trước khi chuyển giao cho các đường ống triển khai và giám sát mô hình .