Thuật ngữ

Công cụ suy luận

Khám phá cách công cụ suy luận hỗ trợ AI bằng cách đưa ra dự đoán theo thời gian thực, tối ưu hóa mô hình và cho phép triển khai đa nền tảng.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Trong lĩnh vực trí tuệ nhân tạo và học máy, một công cụ suy luận là thành phần chịu trách nhiệm triển khai các mô hình đã được đào tạo để đưa ra dự đoán về dữ liệu mới, chưa từng thấy. Nó lấy một mô hình đã được đào tạo và áp dụng vào dữ liệu thực tế để thực hiện các tác vụ như phát hiện đối tượng, phân loại hình ảnh hoặc xử lý ngôn ngữ tự nhiên. Về cơ bản, đó là công cụ thúc đẩy giai đoạn 'suy luận' của học máy, trong đó các mẫu đã học được được sử dụng để phân tích và diễn giải các đầu vào mới, cho phép các hệ thống AI giải quyết vấn đề và đưa ra quyết định theo thời gian thực.

Cách thức hoạt động của công cụ suy luận

Công cụ suy luận hoạt động bằng cách sử dụng các mô hình được đào tạo trước đã trải qua quá trình đào tạo mở rộng trên các tập dữ liệu lớn. Các mô hình này, thường được phát triển bằng các khuôn khổ như PyTorch , chứa kiến thức đã học cần thiết để thực hiện các tác vụ cụ thể. Khi dữ liệu mới, chẳng hạn như hình ảnh hoặc văn bản, được đưa vào công cụ suy luận, nó sẽ xử lý dữ liệu này thông qua mô hình được đào tạo trước. Quá trình này tạo ra đầu ra, có thể là hộp giới hạn phát hiện đối tượng, nhãn phân loại hoặc tình cảm dự đoán. Ví dụ, các mô hình YOLO Ultralytics dựa vào công cụ suy luận để thực hiện phát hiện, phân đoạn và phân loại đối tượng theo thời gian thực trên nhiều nền tảng khác nhau, từ các thiết bị biên bị hạn chế về tài nguyên đến các máy chủ đám mây mạnh mẽ. Hiệu quả của công cụ suy luận rất quan trọng đối với các ứng dụng trong thế giới thực, tác động đến cả tốc độ và độ chính xác của các dự đoán.

Các tính năng chính của công cụ suy luận

  • Suy luận thời gian thực : Công cụ suy luận được thiết kế để tăng tốc độ, cho phép suy luận thời gian thực để đưa ra quyết định ngay lập tức trong môi trường năng động.
  • Triển khai đa nền tảng : Hỗ trợ triển khai trên nhiều phần cứng khác nhau, từ các thiết bị biên như NVIDIA Jetson đến cơ sở hạ tầng đám mây, đảm bảo tính linh hoạt và khả năng mở rộng.
  • Tối ưu hóa mô hình : Các công cụ suy luận thường kết hợp các kỹ thuật tối ưu hóa như lượng tử hóa mô hìnhcắt tỉa mô hình để nâng cao hiệu suất và giảm nhu cầu tính toán.
  • Tích hợp với Bộ tăng tốc phần cứng : Chúng được thiết kế để tận dụng các bộ tăng tốc phần cứng như TensorRTOpenVINO nhằm tối ưu hóa hiệu suất trên các kiến trúc phần cứng cụ thể.
  • Hỗ trợ nhiều định dạng mô hình : Khả năng tương thích với các định dạng mô hình chuẩn như ONNX cho phép tích hợp liền mạch với các mô hình được đào tạo trong các khuôn khổ khác nhau.

Ứng dụng của Công cụ suy luận

1. Lái xe tự động

Trong xe tự lái, động cơ suy luận là trung tâm của hệ thống nhận thức. Chúng xử lý dữ liệu thời gian thực từ các cảm biến như camera và LiDAR để phát hiện vật thể, người đi bộ và vạch kẻ đường, cho phép xe di chuyển an toàn. Các mô hình YOLO Ultralytics , khi được triển khai bằng động cơ suy luận hiệu quả, đảm bảo phát hiện vật thể nhanh chóng và chính xác, điều này rất quan trọng đối với sự an toàn và khả năng phản hồi của xe tự hành.

2. Phân tích hình ảnh y tế

Trong chăm sóc sức khỏe, các công cụ suy luận đang cách mạng hóa chẩn đoán. Ví dụ, trong phân tích hình ảnh y tế , các mô hình được đào tạo để phát hiện các bất thường trong hình ảnh y tế như chụp MRI hoặc CT có thể được triển khai trên các công cụ suy luận để hỗ trợ các bác sĩ X quang. Các công cụ này có thể nhanh chóng phân tích hình ảnh và làm nổi bật các khu vực có thể quan tâm, cải thiện tốc độ và độ chính xác của chẩn đoán, đồng thời hỗ trợ phát hiện sớm các bệnh như khối u não .

Kỹ thuật tối ưu hóa

Để đảm bảo các công cụ suy luận hoạt động tối ưu, nhiều kỹ thuật tối ưu hóa khác nhau được sử dụng. Lượng tử hóa mô hình làm giảm độ chính xác số của trọng số mô hình, giảm kích thước mô hình và tăng tốc tính toán. Cắt tỉa mô hình loại bỏ các kết nối ít quan trọng hơn trong mạng nơ-ron, đơn giản hóa mô hình và cải thiện tốc độ mà không làm mất độ chính xác đáng kể. Tối ưu hóa dành riêng cho phần cứng, chẳng hạn như tận dụng NVIDIA TensorRT trên NVIDIA GPU giúp tăng cường tốc độ suy luận bằng cách điều chỉnh việc thực hiện mô hình theo kiến trúc phần cứng.

Phân biệt các công cụ suy luận từ các khái niệm liên quan

Mặc dù các công cụ suy luận rất quan trọng để triển khai các mô hình AI, nhưng chúng khác với các khuôn khổ đào tạo như PyTorch , được sử dụng để xây dựng và đào tạo các mô hình. Các công cụ suy luận chỉ tập trung vào việc triển khai và thực hiện các mô hình đã được đào tạo. Chúng cũng khác với các hoạt động triển khai mô hình , bao gồm các chiến lược và phương pháp rộng hơn để làm cho các mô hình có thể truy cập và hoạt động trong môi trường thực tế.

Kết thúc

Công cụ suy luận là không thể thiếu để đưa các mô hình AI và máy học từ phòng thí nghiệm vào các ứng dụng thực tế. Khả năng đưa ra dự đoán nhanh chóng, chính xác trên nhiều môi trường khác nhau khiến chúng trở thành nền tảng của cơ sở hạ tầng AI hiện đại. Đối với những người muốn hợp lý hóa việc triển khai AI, các nền tảng như Ultralytics HUB cung cấp các công cụ và tài nguyên để triển khai và quản lý hiệu quả các mô hình AI được hỗ trợ bởi các công cụ suy luận mạnh mẽ.

Đọc tất cả