Ultralytics YOLO によるリアルタイム推論が、自律走行やセキュリティ・システムなどのAIアプリケーションの即時予測をどのように可能にするかをご覧ください。
リアルタイム推論とは、学習された機械学習(ML)モデルが、新しいデータが到着すると即座に予測や決定を行うプロセスを指す。時間をかけて収集されたデータをまとめて処理するバッチ推論とは異なり、リアルタイム推論は低レイテンシーと即時応答を優先します。この機能は、ライブ・データ・ストリームに基づく即時のフィードバックやアクションを必要とするアプリケーションに不可欠であり、変化する状況にシステムが動的に反応することを可能にする。
実際には、リアルタイム推論とは、以下のようなMLモデルを展開することを意味する。 Ultralytics YOLOモデルのようなMLモデルを配置し、個々のデータ入力(ビデオフレームやセンサーの読み取り値など)を分析し、最小限の遅延で出力を生成できるようにすることです。重要なパフォーマンス指標は推論レイテンシ(入力を受けてから予測を生成するまでにかかる時間)です。低遅延を達成するためには、多くの場合、いくつかの戦略が必要となる:
主な違いは、データの処理方法とそれに伴うレイテンシー要件にある:
リアルタイム推論は、瞬時の意思決定が重要な現代のAIアプリケーションの多くを支えている:
Ultralytics HUBのようなプラットフォームは、モデルのトレーニング、最適化、デプロイのためのツールを提供し、様々なデプロイメントオプションにおけるリアルタイム推論ソリューションの実装を容易にする。