Tối ưu hóa các mô hình học máy với chức năng cắt tỉa mô hình. Đạt được tốc độ suy luận nhanh hơn, giảm sử dụng bộ nhớ và hiệu quả năng lượng cho các triển khai có tài nguyên hạn chế.
Cắt tỉa mô hình là một kỹ thuật học máy (ML) được sử dụng để tối ưu hóa các mô hình đã được đào tạo bằng cách giảm kích thước và độ phức tạp của chúng. Điều này liên quan đến việc xác định và loại bỏ các tham số ít quan trọng hơn, chẳng hạn như trọng số mô hình hoặc kết nối trong mạng nơ-ron (NN) , đóng góp tối thiểu vào hiệu suất tổng thể của mô hình. Mục tiêu chính là tạo ra các mô hình nhỏ hơn, nhanh hơn, đòi hỏi ít sức mạnh tính toán và bộ nhớ hơn, thường không làm giảm đáng kể độ chính xác . Quá trình này là một ứng dụng cụ thể của khái niệm cắt tỉa rộng hơn được áp dụng trực tiếp cho các mô hình ML, giúp chúng hiệu quả hơn khi triển khai .
Động lực chính cho việc cắt tỉa mô hình là hiệu quả. Các mô hình học sâu (DL) hiện đại, đặc biệt là trong các lĩnh vực như thị giác máy tính (CV) , có thể cực kỳ lớn và tốn nhiều tài nguyên tính toán. Điều này đặt ra những thách thức cho việc triển khai mô hình , đặc biệt là trên các thiết bị có tài nguyên hạn chế như điện thoại thông minh, hệ thống nhúng hoặc trong các tình huống điện toán biên . Cắt tỉa mô hình giúp giải quyết các vấn đề này bằng cách:
Các kỹ thuật cắt tỉa mô hình có nhiều dạng khác nhau nhưng nhìn chung được chia thành các loại dựa trên mức độ chi tiết của nội dung bị loại bỏ:
Việc cắt tỉa có thể diễn ra sau khi mô hình được đào tạo đầy đủ hoặc được tích hợp vào quy trình đào tạo . Sau khi cắt tỉa, các mô hình thường trải qua quá trình tinh chỉnh (đào tạo thêm về kiến trúc nhỏ hơn) để phục hồi bất kỳ hiệu suất nào bị mất trong quá trình xóa tham số. Các khuôn khổ như PyTorch cung cấp các tiện ích để triển khai các phương pháp cắt tỉa khác nhau, như được hiển thị trong Hướng dẫn cắt tỉa PyTorch .
Việc cắt tỉa mô hình có giá trị trong nhiều lĩnh vực AI:
Cắt tỉa mô hình là một trong số nhiều kỹ thuật được sử dụng để tối ưu hóa mô hình . Nó khác biệt với nhưng thường bổ sung cho:
Các kỹ thuật này có thể được kết hợp; ví dụ, một mô hình có thể được cắt tỉa trước, sau đó lượng tử hóa để đạt hiệu quả tối đa. Các mô hình được tối ưu hóa thường được xuất sang các định dạng chuẩn như ONNX ( tùy chọn xuất Ultralytics ) để có khả năng tương thích triển khai rộng rãi. Các nền tảng như Ultralytics HUB cung cấp môi trường để quản lý các mô hình, tập dữ liệu ( như COCO ) và hợp lý hóa con đường triển khai được tối ưu hóa.