Khám phá cách ONNX nâng cao khả năng di động và khả năng tương tác của mô hình AI, cho phép triển khai liền mạch Ultralytics YOLO mô hình trên nhiều nền tảng khác nhau.
Trong lĩnh vực trí tuệ nhân tạo và máy học, khả năng tương tác là chìa khóa để tận dụng các công cụ tốt nhất và triển khai các mô hình trên nhiều môi trường khác nhau. ONNX (Open Neural Network Exchange) là một định dạng mở được xây dựng để biểu diễn các mô hình học máy, đảm bảo rằng các nhà phát triển AI không bị khóa trong một khuôn khổ duy nhất và có thể hợp lý hóa quy trình di chuyển các mô hình giữa các công cụ khác nhau. Nó cung cấp một biểu diễn thống nhất cho các mô hình, bất kể khuôn khổ nào được sử dụng để đào tạo, giúp triển khai các mô hình này trong nhiều công cụ suy luận, nền tảng phần cứng và môi trường khác nhau trở nên đơn giản hơn.
Sự liên quan chính của ONNX nằm ở khả năng thúc đẩy tính di động và khả năng tương tác trong hệ sinh thái AI. Bằng cách xác định một tập hợp chung các toán tử và một định dạng chuẩn cho các mô hình học máy, ONNX cho phép các mô hình được đào tạo trong các khuôn khổ như PyTorch hoặc TensorFlow để dễ dàng chuyển giao và chạy bằng các công cụ suy luận khác nhau như TensorRT hoặc OpenVINO . Điều này đặc biệt có lợi cho các nhà phát triển sử dụng Ultralytics YOLO các mô hình, như ONNX export giúp đơn giản hóa việc triển khai mô hình trên nhiều nền tảng khác nhau, từ máy chủ đám mây đến các thiết bị biên. Ultralytics tạo điều kiện xuất khẩu các mô hình YOLOv8 sang ONNX định dạng, cho phép người dùng tận dụng các công cụ suy luận được tối ưu hóa để cải thiện hiệu suất và suy luận thời gian thực nhanh hơn.
ONNX Khả năng tương thích giữa các khung làm cho nó có giá trị trong nhiều ứng dụng AI. Hai ví dụ cụ thể là:
Hiểu biết ONNX cũng bao gồm việc nhận ra các khái niệm liên quan đóng vai trò trong việc triển khai và tối ưu hóa mô hình:
.pt
các tập tin) vào ONNX định dạng. Ultralytics cung cấp các công cụ đơn giản cho xuất khẩu YOLO mô hình ĐẾN ONNX và các định dạng khác.Bằng cách áp dụng ONNX , các nhà phát triển có thể đơn giản hóa đáng kể quy trình làm việc AI của mình, giảm độ phức tạp khi triển khai và đảm bảo các mô hình của họ linh hoạt và có hiệu suất cao trên nhiều ứng dụng và nền tảng.