Thuật ngữ

Cắt tỉa mô hình

Tối ưu hóa các mô hình học máy với chức năng cắt tỉa mô hình. Đạt được tốc độ suy luận nhanh hơn, giảm sử dụng bộ nhớ và hiệu quả năng lượng cho các triển khai có tài nguyên hạn chế.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Cắt tỉa mô hình là một kỹ thuật quan trọng trong học máy tập trung vào việc tối ưu hóa các mô hình đã được đào tạo. Nó hợp lý hóa các mô hình bằng cách giảm độ phức tạp và kích thước của chúng, đạt được bằng cách loại bỏ các tham số ít quan trọng hơn—như trọng số và kết nối—khỏi mạng nơ-ron. Quá trình này làm cho các mô hình hiệu quả hơn mà không làm giảm đáng kể hiệu suất, dẫn đến các lợi ích như xử lý nhanh hơn, sử dụng ít bộ nhớ hơn và giảm mức tiêu thụ năng lượng, đặc biệt có lợi cho việc triển khai trong các môi trường có tài nguyên hạn chế.

Tại sao nên sử dụng Model Pruning?

Có một số lý do thuyết phục để sử dụng cắt tỉa mô hình. Đầu tiên, nó làm giảm đáng kể kích thước của các mô hình học máy, giúp chúng dễ triển khai hơn trên các thiết bị có dung lượng lưu trữ hạn chế, chẳng hạn như điện thoại di động hoặc hệ thống biên . Các mô hình nhỏ hơn cũng dẫn đến tốc độ suy luận nhanh hơn, vì cần ít phép tính hơn để tạo dự đoán. Việc tăng tốc độ này rất quan trọng đối với các ứng dụng thời gian thực như phát hiện vật thể trong xe tự hành hoặc để phân tích video trực tiếp . Hơn nữa, các mô hình được cắt tỉa tiêu thụ ít năng lượng hơn, một lợi thế quan trọng đối với các thiết bị chạy bằng pin và các trung tâm dữ liệu quy mô lớn hướng tới các hoạt động AI bền vững .

Các loại cắt tỉa mô hình

Việc cắt tỉa mô hình có thể được phân loại thành hai loại chính:

  • Weight Pruning : Kỹ thuật này tập trung vào việc loại bỏ các trọng số riêng lẻ trong mạng nơ-ron. Nó có thể được chia thành cắt tỉa có cấu trúc và không có cấu trúc. Cắt tỉa không có cấu trúc loại bỏ các trọng số riêng lẻ bất kể vị trí của chúng, dẫn đến các mẫu truy cập bộ nhớ thưa thớt nhưng có khả năng không đều. Mặt khác, cắt tỉa có cấu trúc loại bỏ toàn bộ các cấu trúc như bộ lọc hoặc kênh, tạo ra các mô hình nhỏ gọn hơn và thân thiện với phần cứng hơn.
  • Cắt tỉa nơ-ron : Cắt tỉa nơ-ron, còn được gọi là cắt tỉa nút hoặc đơn vị, bao gồm việc loại bỏ toàn bộ nơ-ron hoặc nút khỏi mạng nơ-ron. Phương pháp này đơn giản hóa kiến trúc mạng mạnh mẽ hơn cắt tỉa trọng số và đôi khi có thể dẫn đến tăng tốc đáng kể hơn và giảm kích thước mô hình.

Cắt tỉa mô hình so với các kỹ thuật tối ưu hóa khác

Trong khi việc cắt tỉa mô hình làm giảm kích thước mô hình bằng cách loại bỏ các tham số, các kỹ thuật khác như lượng tử hóa mô hìnhchưng cất kiến thức cung cấp các chiến lược tối ưu hóa thay thế. Lượng tử hóa làm giảm độ chính xác của trọng số (ví dụ: từ số dấu phẩy động 32 bit thành số nguyên 8 bit), điều này cũng làm giảm kích thước mô hình và tăng tốc tính toán mà không làm thay đổi cấu trúc mô hình. Chưng cất kiến thức đào tạo một mô hình "học sinh" nhỏ hơn để mô phỏng hành vi của một mô hình "giáo viên" lớn hơn, phức tạp hơn. Các kỹ thuật này thường được sử dụng kết hợp với việc cắt tỉa để đạt được hiệu quả thậm chí còn lớn hơn. Ví dụ, trước tiên, một mô hình có thể được cắt tỉa để giảm kích thước của nó và sau đó lượng tử hóa để tối ưu hóa hiệu suất của nó hơn nữa cho việc triển khai.

Ứng dụng thực tế của việc cắt tỉa mô hình

Việc cắt tỉa mô hình được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau, đặc biệt là khi tài nguyên tính toán bị hạn chế hoặc hiệu quả là tối quan trọng. Một số ứng dụng chính bao gồm:

  • Thiết bị di động và Edge : Triển khai các mô hình Ultralytics YOLO trên thiết bị di động để phát hiện đối tượng và xử lý hình ảnh theo thời gian thực đòi hỏi các mô hình hiệu quả. Việc cắt tỉa giúp giảm kích thước và độ trễ của mô hình, giúp chạy các tác vụ AI phức tạp trên điện thoại thông minh và thiết bị IoT .
  • Xe tự hành : Xe tự lái đòi hỏi phải đưa ra quyết định nhanh chóng dựa trên dữ liệu cảm biến. Các mô hình được cắt tỉa đảm bảo suy luận nhanh cho các nhiệm vụ quan trọng như phát hiện người đi bộ và giữ làn đường, trong đó độ trễ thấp rất quan trọng đối với sự an toàn.

Kết thúc

Cắt tỉa mô hình là một kỹ thuật tối ưu hóa thiết yếu để triển khai các mô hình học máy hiệu quả. Bằng cách giảm kích thước và độ phức tạp của mô hình, nó cho phép suy luận nhanh hơn, sử dụng bộ nhớ thấp hơn và giảm mức tiêu thụ năng lượng. Ultralytics cung cấp một bộ công cụ và tài nguyên giúp người dùng tối ưu hóa mô hình của họ, bao gồm các kỹ thuật như cắt tỉa để nâng cao tính thực tế và hiệu quả của các ứng dụng thị giác máy tính trong nhiều tình huống triển khai khác nhau.

Đọc tất cả