Ultralytics YOLO によるリアルタイム推論が、自律走行やセキュリティ・システムなどのAIアプリケーションの即時予測をどのように可能にするかをご覧ください。
リアルタイム推論とは、新しいデータが利用可能になるとすぐに機械学習モデルを使って予測を行うプロセスである。これはバッチ推論とは対照的で、時間をかけて収集されたデータポイント群に基づいて予測が行われる。リアルタイム推論では、スピードと即時性が重視され、システムは最新の情報に基づいて瞬時に反応し、意思決定を行うことができる。
機械学習の文脈では、特にUltralytics YOLO のようなモデルでは、リアルタイム推論とは、モデルが個々のデータ入力(画像やビデオフレームなど)を処理し、ほとんど瞬時に予測を生成できることを意味する。この能力は、タイムリーな応答が不可欠なアプリケーションにとって極めて重要である。例えば、物体検出では、リアルタイム推論により、モデルはライブ・ビデオ・ストリーム中の物体を顕著な遅延なしに識別し、位置を特定することができる。
リアルタイム推論の効率は、推論レイテンシ(モデルが1つの入力から予測を生成するのにかかる時間)によって測定されることが多い。低レイテンシは、リアルタイムシステムが効果的に機能するために不可欠である。低レイテンシを達成するために、モデルはしばしばモデルの量子化やモデルの刈り込みのような技術によって高速化のために最適化されるか、GPUや TPUのような特殊なハードウェア上に展開される。フレームワーク TensorRTNVIDIA のようなフレームワークも推論を高速化するように設計されており、リアルタイム性能をより達成しやすくしている。
リアルタイム推論は、様々な業界における数多くの最先端アプリケーションを支えている。具体的な例をいくつか紹介しよう:
これらの例は、急速に変化するデータに基づいて瞬時に意思決定を行い、対応することが求められるアプリケーションにおいて、リアルタイム推論が果たす重要な役割を浮き彫りにしている。AI技術が進歩するにつれて、リアルタイム推論は、よりダイナミックで応答性の高いシステムを実現し、業界全体の自動化とインテリジェンスを強化し続けるだろう。Ultralytics モデルによるリアルタイム推論を実装しようとしている人々にとって、Ultralytics HUB のようなプラットフォームは、効率的でリアルタイムなパフォーマンスを実現するモデルのトレーニング、最適化、およびデプロイのためのツールを提供します。