Tối ưu hóa các mô hình học máy với chức năng cắt tỉa mô hình. Đạt được tốc độ suy luận nhanh hơn, giảm sử dụng bộ nhớ và hiệu quả năng lượng cho các triển khai có tài nguyên hạn chế.
Cắt tỉa mô hình là một kỹ thuật quan trọng trong học máy tập trung vào việc tối ưu hóa các mô hình đã được đào tạo. Nó hợp lý hóa các mô hình bằng cách giảm độ phức tạp và kích thước của chúng, đạt được bằng cách loại bỏ các tham số ít quan trọng hơn—như trọng số và kết nối—khỏi mạng nơ-ron. Quá trình này làm cho các mô hình hiệu quả hơn mà không làm giảm đáng kể hiệu suất, dẫn đến các lợi ích như xử lý nhanh hơn, sử dụng ít bộ nhớ hơn và giảm mức tiêu thụ năng lượng, đặc biệt có lợi cho việc triển khai trong các môi trường có tài nguyên hạn chế.
Có một số lý do thuyết phục để sử dụng cắt tỉa mô hình. Đầu tiên, nó làm giảm đáng kể kích thước của các mô hình học máy, giúp chúng dễ triển khai hơn trên các thiết bị có dung lượng lưu trữ hạn chế, chẳng hạn như điện thoại di động hoặc hệ thống biên . Các mô hình nhỏ hơn cũng dẫn đến tốc độ suy luận nhanh hơn, vì cần ít phép tính hơn để tạo dự đoán. Việc tăng tốc độ này rất quan trọng đối với các ứng dụng thời gian thực như phát hiện vật thể trong xe tự hành hoặc để phân tích video trực tiếp . Hơn nữa, các mô hình được cắt tỉa tiêu thụ ít năng lượng hơn, một lợi thế quan trọng đối với các thiết bị chạy bằng pin và các trung tâm dữ liệu quy mô lớn hướng tới các hoạt động AI bền vững .
Việc cắt tỉa mô hình có thể được phân loại thành hai loại chính:
Trong khi việc cắt tỉa mô hình làm giảm kích thước mô hình bằng cách loại bỏ các tham số, các kỹ thuật khác như lượng tử hóa mô hình và chưng cất kiến thức cung cấp các chiến lược tối ưu hóa thay thế. Lượng tử hóa làm giảm độ chính xác của trọng số (ví dụ: từ số dấu phẩy động 32 bit thành số nguyên 8 bit), điều này cũng làm giảm kích thước mô hình và tăng tốc tính toán mà không làm thay đổi cấu trúc mô hình. Chưng cất kiến thức đào tạo một mô hình "học sinh" nhỏ hơn để mô phỏng hành vi của một mô hình "giáo viên" lớn hơn, phức tạp hơn. Các kỹ thuật này thường được sử dụng kết hợp với việc cắt tỉa để đạt được hiệu quả thậm chí còn lớn hơn. Ví dụ, trước tiên, một mô hình có thể được cắt tỉa để giảm kích thước của nó và sau đó lượng tử hóa để tối ưu hóa hiệu suất của nó hơn nữa cho việc triển khai.
Việc cắt tỉa mô hình được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau, đặc biệt là khi tài nguyên tính toán bị hạn chế hoặc hiệu quả là tối quan trọng. Một số ứng dụng chính bao gồm:
Cắt tỉa mô hình là một kỹ thuật tối ưu hóa thiết yếu để triển khai các mô hình học máy hiệu quả. Bằng cách giảm kích thước và độ phức tạp của mô hình, nó cho phép suy luận nhanh hơn, sử dụng bộ nhớ thấp hơn và giảm mức tiêu thụ năng lượng. Ultralytics cung cấp một bộ công cụ và tài nguyên giúp người dùng tối ưu hóa mô hình của họ, bao gồm các kỹ thuật như cắt tỉa để nâng cao tính thực tế và hiệu quả của các ứng dụng thị giác máy tính trong nhiều tình huống triển khai khác nhau.