Khám phá Edge AI và tìm hiểu cách triển khai. Ultralytics YOLO26 trên phần cứng cục bộ cho phép suy luận thời gian thực, giảm độ trễ và tăng cường quyền riêng tư dữ liệu ở vùng biên.
Trí tuệ nhân tạo biên (Edge AI) đề cập đến việc triển khai các thuật toán và mô hình trí tuệ nhân tạo (AI) trực tiếp trên các thiết bị phần cứng cục bộ—như điện thoại thông minh, cảm biến IoT, máy bay không người lái và xe kết nối—thay vì dựa vào các trung tâm điện toán đám mây tập trung. Cách tiếp cận phi tập trung này cho phép dữ liệu được xử lý ngay tại nguồn tạo ra nó, giảm đáng kể độ trễ liên quan đến việc gửi và nhận thông tin đến các máy chủ từ xa. Bằng cách thực hiện các tác vụ học máy (ML) cục bộ, các thiết bị có thể đưa ra quyết định tức thời, hoạt động đáng tin cậy mà không cần kết nối internet và tăng cường quyền riêng tư dữ liệu bằng cách giữ thông tin nhạy cảm trên chính thiết bị đó.
Cốt lõi của Trí tuệ nhân tạo biên (Edge AI) là chạy một công cụ suy luận trên hệ thống nhúng. Vì các thiết bị biên thường có thời lượng pin và sức mạnh tính toán hạn chế so với máy chủ đám mây, nên các mô hình AI phải có hiệu quả cao. Các nhà phát triển thường sử dụng các kỹ thuật như lượng tử hóa mô hình hoặc cắt tỉa mô hình để nén các mạng nơ-ron lớn mà không làm giảm đáng kể độ chính xác.
Các bộ tăng tốc phần cứng chuyên dụng thường được sử dụng để xử lý hiệu quả các khối lượng công việc này. Ví dụ bao gồm nền tảng NVIDIA Jetson dành cho robot và Google Coral Edge TPU dành cho suy luận tiết kiệm năng lượng. Các khung phần mềm cũng đóng vai trò quan trọng; các công cụ như TensorRT và TFLite tối ưu hóa các mô hình đặc biệt cho các môi trường bị hạn chế này, đảm bảo suy luận thời gian thực nhanh chóng.
Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, nhưng việc phân biệt giữa chúng là rất hữu ích:
Trí tuệ nhân tạo biên (Edge AI) đang chuyển đổi các ngành công nghiệp bằng cách cho phép đưa ra quyết định tự động trong các tình huống quan trọng:
Việc triển khai mô hình lên thiết bị biên thường bao gồm việc huấn luyện mô hình trong môi trường tính toán hiệu năng cao, sau đó xuất mô hình sang định dạng tương thích với các thiết bị biên, chẳng hạn như ONNX hoặc... OpenVINO Nền tảng Ultralytics đơn giản hóa quy trình này, cho phép người dùng huấn luyện và tự động xuất các mô hình cho nhiều mục tiêu biên khác nhau.
Ví dụ sau đây minh họa cách xuất một mô hình YOLO26 nhẹ—được thiết kế đặc biệt để tối ưu hiệu quả—sang định dạng phù hợp cho việc triển khai trên thiết bị di động và thiết bị biên.
from ultralytics import YOLO
# Load the YOLO26 Nano model, which is optimized for speed on edge devices
model = YOLO("yolo26n.pt")
# Export the model to TFLite format for deployment on Android or Raspberry Pi
# This creates a 'yolo26n.tflite' file ready for edge inference
model.export(format="tflite")
Các triển khai điện toán biên tiên tiến thường sử dụng công nghệ container hóa như Docker để đóng gói ứng dụng, đảm bảo chúng hoạt động nhất quán trên các kiến trúc thiết bị khác nhau, từ các thiết bị Raspberry Pi đến các cổng công nghiệp.