Ultralytics YOLOによるリアルタイム推論が、自律走行やセキュリティシステムなどのAIアプリケーションでどのように瞬時の予測を可能にするかをご覧ください。
リアルタイム推論とは、訓練された機械学習(ML)モデルを使用して、新しいライブデータに対して最小限の遅延で予測を行うプロセスである。AIや コンピュータビジョン(CV)の文脈では、これはシステムがビデオストリームのような情報を処理し、ほぼ瞬時に出力を生成できることを意味する。目標は、推論のレイテンシーを十分に低くして、結果がすぐに意思決定に役立つようにすることである。この能力は、タイミングが重要なアプリケーションにとって極めて重要であり、自動車からヘルスケアまで、AIを活用する業界を変革する。
リアルタイム推論とバッチ推論を区別することは重要である。重要な違いは、データの処理方法にある。
どちらも訓練されたモデルを使って予測を行うが、結果の緊急性に基づいて、その使用ケースは根本的に異なる。
即座に意思決定ができるため、さまざまな分野で幅広い強力な応用が可能になる。
リアルタイム・コンピューティング・アプリケーションでモデルを十分に高速に動作させるには、多くの場合、大幅な最適化が必要になる:
Ultralytics YOLOのようなモデルは、効率性と精度を念頭に設計されており、リアルタイムの物体検出タスクに適しています。Ultralytics HUBのようなプラットフォームは、モデルのトレーニング、最適化(ONNXやTensorRTフォーマットへのエクスポートなど)、デプロイを行うツールを提供し、様々なデプロイメントオプションにおけるリアルタイム推論ソリューションの実装を容易にします。