用語集

リアルタイム推論

自律走行やヘルスケアなどにおける迅速な意思決定を可能にする、AIにおける即時予測のためのリアルタイム推論のパワーをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

リアルタイム推論は、機械学習(ML)モデルを展開する上で重要な側面である。リアルタイム推論とは、学習済みのMLモデルを使って、新しい未知のデータに対してほぼ瞬時に予測を行うプロセスを指す。データが大きな塊で処理されるバッチ処理とは異なり、リアルタイム推論はデータが到着するとそれを処理し、即座に洞察を提供し、迅速な意思決定を可能にする。この機能は、自律走行、ライブビデオ分析、インタラクティブなユーザー体験など、即時のフィードバックを必要とするアプリケーションにとって極めて重要である。

リアルタイム推論の重要性

リアルタイム推論の重要性は、即座に予測を行うことができる点にあり、遅延がパフォーマンスやユーザーエクスペリエンスに大きな影響を与えるアプリケーションには不可欠である。例えば、自律走行車では、リアルタイム推論により、様々なセンサーからのデータに基づいて車が瞬時に判断を下し、安全性と応答性を確保することができる。同様に、ヘルスケアでは、医療画像をリアルタイムで分析することで、迅速な診断と治療計画の立案に役立てることができる。データを瞬時に処理し反応する能力こそが、リアルタイム推論を多くの最新AIアプリケーションの要にしている。

リアルタイム推論に関連する主要概念

リアルタイム推論には、いくつかの重要な概念が密接に関係している:

  • 遅延:モデルにデータを入力してから予測を受け取るまでの時間的な遅れを指す。低レイテンシはリアルタイム・アプリケーションにとって極めて重要です。モデルの量子化やモデルの刈り込みなどの技術は、モデルのサイズと複雑さを軽減し、レイテンシを低減するのに役立ちます。
  • スループット:単位時間当たりにモデルが処理するデータ量を測定する。大量の入力データを効率的に処理するには、高いスループットが不可欠です。
  • エッジコンピューティング:スマートフォンやIoTデバイスなどのエッジデバイスで推論を実行することで、中央サーバーにデータを送信する必要性が減り、待ち時間が短縮され、応答性が向上します。エッジAIの実世界での応用を理解するための詳細をご覧ください。
  • モデルの最適化:推論のためにモデルを最適化するには、モデルを以下のような特殊なフォーマットに変換するなどのテクニックが必要である。 TensorRTTFLiteのような、特定のハードウェア上で効率的に実行できるように設計された特殊な形式にモデルを変換するなどのテクニックがあります。

リアルタイム推論の実世界での応用

リアルタイム推論は、さまざまな業界にわたる幅広いアプリケーションを強力にサポートする:

  1. 自律走行車:自動運転車は、カメラ、ライダー、その他のセンサーからのデータを処理するリアルタイム推論に依存している。システムは物体を検出し、分類し、ミリ秒単位で運転判断を下さなければならない。Ultralytics YOLO モデルはこの分野に優れており、安全な自律走行ナビゲーションに不可欠な、高速で正確な物体検出を提供する。
  2. ビデオ監視:ビデオ・フィードのリアルタイム分析により、不審な行動や異常を即座に検知することができます。例えば、セキュリティシステムは、リアルタイム推論を使用して、不正アクセスを特定したり、異常な行動を検出したり、対象物を追跡したりすることができます。
  3. ヘルスケア医療画像診断では、リアルタイム推論がX線、MRI、その他のスキャン画像の即時分析を支援し、迅速かつ正確な診断に役立つ。これは、タイムリーな判断が救命につながる緊急事態において特に有用である。
  4. 産業オートメーション:リアルタイム推論は、製造プロセスの監視、製品の欠陥の検出、生産ラインの最適化にその場で使用することができます。これにより、効率が向上し、無駄が削減され、高品質の生産が保証されます。
  5. 小売業リアルタイム推論は、顧客の行動を分析し、在庫を管理し、ショッピング体験をパーソナライズするために、スマート小売ソリューションで使用されている。例えば、リアルタイム推論機能を備えたカメラは、顧客の動きを追跡し、購買パターンを分析し、商品の配置をリアルタイムで最適化することができる。

リアルタイム推論とバッチ処理

リアルタイム推論もバッチ処理も、機械学習モデルを展開するための手法ではあるが、それぞれ目的が異なり、向いているアプリケーションも異なる。

リアルタイム推論は、ほぼ瞬時にデータを処理して予測を生成するため、即時のフィードバックを必要とするアプリケーションに最適である。この方法は、低レイテンシーと応答性を優先します。

一方、バッチ処理では、大量のデータをスケジュールされた間隔でバッチ処理する。この方法は、日次レポートの作成や大規模なデータ分析の実行など、即座の結果が重要でないアプリケーションに適している。バッチ処理では、大量のデータセットを処理する際の高いスループットと効率が優先される。

リアルタイム推論とバッチ処理のどちらを選択するかは、アプリケーションの特定の要件に依存する。リアルタイム推論は、インタラクティブで時間に敏感なアプリケーションに不可欠であり、バッチ処理は、すぐに結果を得る必要がなく大量のデータを処理する必要があるタスクに適しています。モデル展開のオプションとベストプラクティスについては、Ultralytics のドキュメントを参照してください。

結論

リアルタイム推論は、AIや機械学習の分野において、瞬時の予測と迅速な意思決定を可能にする強力な能力である。その重要性は、自律走行車やビデオ監視からヘルスケアや産業オートメーションに至るまで、幅広いアプリケーションにおいて明らかである。リアルタイム推論に関連する主要な概念と技術を理解することで、開発者はこの技術を活用し、即座に価値を提供し、ユーザー体験を向上させる革新的なソリューションを生み出すことができる。AIが進化し続ける中、リアルタイム推論はテクノロジーの未来を形作る上でますます重要な役割を果たすことは間違いない。詳しくは Ultralytics YOLOリアルタイム物体検出やその他のコンピュータ・ビジョン・タスクにおける最先端の進歩を探るには、モデルのページをご覧ください。

すべて読む