Thuật ngữ

Mô hình phục vụ

Tìm hiểu những điều cơ bản về phục vụ mô hình—triển khai các mô hình AI để dự đoán theo thời gian thực, khả năng mở rộng và tích hợp liền mạch vào các ứng dụng.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Sau khi mô hình Học máy (ML) được đào tạo và xác thực, bước quan trọng tiếp theo là làm cho nó khả dụng để tạo dự đoán trên dữ liệu mới. Quá trình này được gọi là Phục vụ mô hình. Nó bao gồm việc triển khai một mô hình đã đào tạo vào môi trường sản xuất, thường là đằng sau điểm cuối API, cho phép các ứng dụng hoặc hệ thống khác yêu cầu dự đoán theo thời gian thực. Phục vụ mô hình đóng vai trò là cầu nối giữa mô hình đã phát triển và ứng dụng thực tế của nó, biến nó từ một tệp tĩnh thành một dịch vụ hoạt động, tạo ra giá trị trong Vòng đời học máy rộng hơn.

Tầm quan trọng của việc phục vụ mô hình

Phục vụ mô hình là nền tảng cho việc vận hành các mô hình ML. Nếu không có nó, ngay cả những mô hình chính xác nhất, như máy dò đối tượng YOLO Ultralytics hiện đại, vẫn bị cô lập trong môi trường phát triển, không thể tác động đến các quy trình trong thế giới thực. Phục vụ mô hình hiệu quả đảm bảo:

Ứng dụng trong thế giới thực

Mô hình phục vụ cho phép vô số tính năng do AI điều khiển mà chúng ta tương tác hàng ngày. Sau đây là hai ví dụ:

  1. Đề xuất sản phẩm thương mại điện tử: Khi bạn duyệt một cửa hàng trực tuyến, một mô hình phục vụ phần phụ trợ sẽ cung cấp năng lượng cho hệ thống đề xuất . Nó lấy lịch sử duyệt web hoặc hồ sơ người dùng của bạn làm đầu vào và trả về các đề xuất sản phẩm được cá nhân hóa theo thời gian thực.
  2. Hỗ trợ chẩn đoán y khoa: Trong chăm sóc sức khỏe, các mô hình được đào tạo để phân tích hình ảnh y khoa có thể được phục vụ thông qua API. Bác sĩ có thể tải ảnh chụp bệnh nhân (như X-quang hoặc MRI) lên dịch vụ, sau đó trả về các bất thường tiềm ẩn hoặc thông tin chẩn đoán, hỗ trợ ra quyết định lâm sàng. Các nền tảng như Ultralytics HUB tạo điều kiện triển khai các mô hình chuyên biệt như vậy.

Các thành phần chính của mô hình phục vụ

Việc triển khai một hệ thống phục vụ mô hình mạnh mẽ bao gồm một số thành phần:

  • Định dạng mô hình: Mô hình được đào tạo cần được lưu ở định dạng phù hợp để triển khai, chẳng hạn như ONNX , TensorFlow SavedModel hoặc các định dạng được tối ưu hóa như TensorRT .
  • Serving Framework: Phần mềm như TensorFlow Serving , TorchServe hoặc NVIDIA Triton Inference Server quản lý vòng đời mô hình, xử lý yêu cầu và thực hiện suy luận.
  • Điểm cuối API: Một giao diện (thường được quản lý bởi API Gateway ) cung cấp khả năng dự đoán của mô hình cho các ứng dụng khách hàng.
  • Cơ sở hạ tầng: Môi trường phần cứng và phần mềm cơ bản, có thể là máy chủ tại chỗ, phiên bản điện toán đám mây hoặc thậm chí là các thiết bị điện toán biên chuyên dụng.
  • Giám sát: Các công cụ và quy trình giám sát mô hình theo dõi hiệu suất, độ trễ, lỗi và khả năng dữ liệu trôi dạt để đảm bảo mô hình được phục vụ vẫn hiệu quả theo thời gian.

Triển khai mô hình so với phục vụ mô hình

Mặc dù các thuật ngữ Triển khai mô hình và Phục vụ mô hình thường có liên quan, nhưng chúng không giống hệt nhau. Triển khai mô hình là khái niệm rộng hơn về việc tạo ra một mô hình đã được đào tạo để sử dụng. Điều này có thể bao gồm nhiều chiến lược khác nhau, bao gồm nhúng mô hình trực tiếp vào các ứng dụng, triển khai chúng vào các thiết bị biên để suy luận ngoại tuyến hoặc thiết lập các đường ống xử lý hàng loạt chạy dự đoán theo định kỳ. Bạn có thể khám phá các Tùy chọn triển khai mô hình khác nhau tùy theo nhu cầu của mình.

Phục vụ mô hình cụ thể đề cập đến việc triển khai một mô hình như một dịch vụ mạng, thường có thể truy cập thông qua API, được thiết kế để xử lý các yêu cầu dự đoán theo yêu cầu, thường là theo thời gian thực. Đây là một loại triển khai mô hình cụ thể tập trung vào việc cung cấp khả năng suy luận liên tục với các cân nhắc về khả năng mở rộng và độ trễ thấp. Đối với nhiều ứng dụng tương tác yêu cầu dự đoán ngay lập tức, phục vụ mô hình là phương pháp triển khai được ưu tiên.

Đọc tất cả