Ultralytics YOLOによるリアルタイム推論が、自律走行やセキュリティシステムなどのAIアプリケーションでどのように瞬時の予測を可能にするかをご覧ください。
リアルタイム推論とは、学習された機械学習(ML)モデルが、新しいデータが到着すると即座に予測や決定を行うプロセスを指す。時間をかけて収集されたデータをまとめて処理するバッチ推論とは異なり、リアルタイム推論は低レイテンシーと即時応答を優先します。この機能は、ライブ・データ・ストリームに基づく即時のフィードバックやアクションを必要とするアプリケーションに不可欠であり、リアルタイム・コンピューティングの原則に沿い、変化する状況にシステムが動的に反応することを可能にする。
実際には、リアルタイム推論とは、個々のデータ入力(ビデオフレームやセンサーの読み取り値など)を分析し、最小限の遅延で出力を生成できるように、コンピュータビジョン(CV)用のUltralytics YOLOモデルなどのMLモデルを展開することを意味する。重要なパフォーマンス指標は推論レイテンシ(入力を受けてから予測を生成するまでにかかる時間)です。低遅延を達成するには、モデル自体の最適化や、特殊なハードウェアやソフトウェアの活用など、いくつかの戦略が必要になることが多い。
主な違いは、データの処理方法とそれに伴うレイテンシー要件にある:
リアルタイム推論は、瞬時の意思決定が重要な現代の人工知能(AI)アプリケーションの多くに力を与えている:
リアルタイム・アプリケーションでモデルを十分に高速に動作させるには、多くの場合、大幅な最適化が必要になる:
Ultralytics YOLO11のようなモデルは、効率性と精度を念頭に置いて設計されているため、リアルタイムの物体検出タスクに適しています。Ultralytics HUBのようなプラットフォームは、モデルのトレーニング、最適化(ONNXやTensorRTフォーマットへのエクスポートなど)、デプロイを行うツールを提供し、様々なデプロイメントオプションにおけるリアルタイム推論ソリューションの実装を容易にします。