リアルタイム視覚AI推論：スピードと応用

私たちは皆、遅いインターネット接続が引き起こす不満を経験したことがあるでしょう。しかし、自動運転車が障害物に反応したり、医師が重要なスキャンを分析したりするなど、重大な状況での遅延を想像してみてください。数秒の遅れが深刻な結果を招く可能性があります。

そこで、リアルタイムAI推論が違いを生むことができます。高速処理とリアルタイム予測により、コンピュータビジョンソリューションは視覚データを即座に処理して対応できます。これらの瞬間的な意思決定は、安全性、効率性、および日常の利便性を向上させることができます。

例えば、外科医がロボットアシスタントを使用して繊細な手術を行うことを考えてみましょう。すべての動きは高速接続を介して制御され、ロボットのビジョンシステムは手術部位をリアルタイムで処理し、外科医に即座に視覚的なフィードバックを提供します。このフィードバックループのわずかな遅延でも重大なミスにつながり、患者を危険にさらす可能性があります。これは、リアルタイム推論が非常に重要である理由の完璧な例です。遅延は許されません。

実世界アプリケーションにおけるAI推論は、推論エンジン（AIモデルを効率的に実行するソフトウェアまたはハードウェア）、推論レイテンシ（入力と出力の間の遅延）、およびリアルタイム推論（最小限の遅延で処理および応答するAIシステムの能力）という3つの主要な概念に依存します。

この記事では、これらのコアコンセプトと、次のようなコンピュータビジョンモデルについて説明します。 Ultralytics YOLO11のようなコンピュータビジョンモデルが、どのように瞬時の予測に依存するアプリケーションを可能にするのかを探ります。

AI推論とは？

推論の実行とは、トレーニング済みのAIモデルを使用して新しいデータを分析し、予測を行ったり、タスクを解決したりするプロセスです。大量のラベル付きデータを処理してモデルを学習させるトレーニングとは異なり、推論は、すでにトレーニングされたモデルを使用して、迅速かつ正確に結果を生成することに重点を置いています。

__wf_reserved_inherit — 図1. 推論とは何かを理解する。

‍

例えば、野生動物の保護では、AIカメラトラップはコンピュータ・ビジョン・モデルを使用してリアルタイムで動物を識別・classify する。カメラが動きを検知すると、AIモデルはそれがシカなのか、肉食動物なのか、あるいは密猟者なのかを瞬時に認識し、研究者が動物の個体数をtrack し、人間の介入なしに絶滅危惧種を保護するのに役立つ。この迅速な識別により、リアルタイムのモニタリングと潜在的脅威への迅速な対応が可能になる。

推論エンジンの理解

学習済み機械学習モデルは、必ずしもそのままの形でデプロイできるとは限りません。推論エンジンは、機械学習モデルを効率的に実行し、実際のデプロイメントに向けて最適化するために設計された特殊なソフトウェアまたはハードウェアツールです。モデル圧縮、量子化、グラフ変換などの最適化技術を使用して、パフォーマンスを向上させ、リソース消費を削減し、さまざまな環境にモデルをデプロイできるようにします。

推論エンジンの核心は、計算オーバーヘッドの削減、レイテンシの最小化、および高速かつ正確な予測を可能にする効率の向上に重点を置いています。最適化されると、エンジンは新しいデータでモデルを実行し、リアルタイムで効率的に推論を生成できます。この最適化により、AIモデルは、高性能クラウドサーバーと、スマートフォン、IoTデバイス、組み込みシステムなどのリソースが制約されたエッジデバイスの両方でスムーズに実行できます。

推論レイテンシによって引き起こされる問題

推論レイテンシとは、AIシステムが入力データ（カメラからの画像など）を受信してから、出力（画像内のオブジェクトの検出など）を生成するまでの時間遅延です。わずかな遅延でも、リアルタイムAIアプリケーションのパフォーマンスとユーザビリティに大きな影響を与える可能性があります。

推論レイテンシは、主に次の3つの段階で発生します。

前処理時間: モデルに入力する前に、入力データを準備するために必要な時間。これには、モデルの入力サイズに合わせて画像のリサイズ、精度向上のためのピクセル値の正規化、および形式の変換（例：RGBからグレースケール、またはビデオからフレームシーケンス）が含まれます。
‍
計算時間：モデルが推論を実行するのにかかる実際の時間。これには、深層ネットワークにおけるレイヤーごとの計算、行列乗算、畳み込み、およびメモリと処理ユニット間のデータ転送などの操作が含まれます。
‍
後処理時間: 生のモデル出力を意味のある結果に変換するために必要な時間。これには、物体検出におけるバウンディングボックスの描画、画像認識における偽陽性のフィルタリング、または異常検出における閾値の適用が含まれます。

推論レイテンシは、リアルタイムアプリケーションにおいて非常に重要です。たとえば、組立ラインでの自動欠陥検出では、コンピュータビジョンを使用して、コンベヤーベルト上を移動する製品を検査できます。

システムは、製品が次の段階に進む前に、欠陥を迅速に特定してフラグを立てる必要があります。モデルの画像処理に時間がかかりすぎると、欠陥のあるアイテムを時間内に検出できず、材料の無駄、コストのかかる手直し、または欠陥のある製品が顧客に届く可能性があります。レイテンシを削減することで、製造業者は品質管理を改善し、効率を高め、損失を削減できます。

推論レイテンシを削減する方法

推論の遅延を最小限に抑えることは、多くのコンピュータビジョンアプリケーションにおいて不可欠です。これを実現するために、さまざまな手法を使用できます。ここでは、推論の遅延を短縮するために使用される最も一般的な手法について説明します。

モデルの枝刈り

モデルの枝刈りは、不要な接続（重み）を削除してニューラルネットワークを簡素化し、モデルをより小さく、より高速にします。このプロセスにより、モデルの計算負荷が軽減され、精度に大きな影響を与えることなく速度が向上します。

プルーニングは、最も重要な接続のみを維持することで、効率的な推論とより優れたパフォーマンスを保証します。特に、処理能力が限られたデバイスでは有効です。モバイルAI、ロボット工学、エッジコンピューティングなどのリアルタイムアプリケーションで広く使用されており、信頼性を維持しながら効率を高めます。

‍

モデルの量子化

モデルの量子化は、AIモデルが計算に使用する数値を簡素化することで、AIモデルの実行を高速化し、メモリの使用量を削減する技術です。通常、これらのモデルは32ビットの浮動小数点数を使用しますが、これは非常に正確ですが、多くの処理能力を必要とします。量子化は、これらの数値を8ビット整数に減らすことで、処理が容易になり、占有スペースが少なくなります。

‍

効率的なモデルを使用

AIモデルの設計は、予測をいかに迅速に行えるかに大きな影響を与える。YOLO11ようなモデルは、効率的な推論のために構築されており、処理速度が重要なアプリケーションに最適である。

AIソリューションを構築する際には、利用可能なリソースとパフォーマンスのニーズに基づいて適切なモデルを選択することが重要です。重すぎるモデルから始めると、処理時間の遅延、消費電力の増加、リソースが限られたデバイスへの展開の困難さなどの問題が発生しやすくなります。軽量モデルは、特にリアルタイムおよびエッジアプリケーションにおいて、スムーズなパフォーマンスを保証します。

速度 vs. 精度：リアルタイム推論の最適化

レイテンシを削減するためのさまざまな手法がある一方で、リアルタイム推論の重要な要素は、速度と精度のバランスを取ることです。モデルを高速化するだけでは不十分で、精度を損なうことなく推論速度を最適化する必要があります。迅速であっても不正確な予測を生成するシステムは効果的ではありません。そのため、モデルが実際の状況で適切に機能することを保証するために、徹底的なテストが不可欠です。テスト中は高速に見えても、実際の条件下では失敗するシステムは、真に最適化されているとは言えません。

リアルタイム推論を活用するVision AIアプリケーション

次に、リアルタイム推論が、視覚入力に対する即時の応答を可能にすることで、業界を変革している実際のアプリケーションをいくつか順を追って説明します。

小売店でのセルフレジシステム

YOLO11 ようなコンピュータ・ビジョン・モデルは、商品認識をより迅速かつ正確にすることで、セルフレジ・システムの改善に役立ちます。YOLO1111は、物体検出やインスタンスのセグメンテーションなど、様々なコンピューター・ビジョン・タスクをサポートしているため、バーコードが欠落していたり、破損していたりしても、商品を識別することが可能です。ビジョンAIは、手入力の必要性を減らし、チェックアウトプロセスをスピードアップすることができます。

商品識別だけでなく、コンピュータ・ビジョンをセルフレジ・システムに組み込むことで、価格の確認、不正行為の防止、顧客の利便性向上を図ることができる。AIを搭載したカメラは、類似商品を自動的に区別し、レジでの不審な行動をdetect ことができる。これには、顧客やレジ係が意図せず商品を見落とす「ノンスキャン」や、より高価な商品の上に安価なバーコードを貼る「商品のすり替え」など、より意図的な不正行為の識別も含まれる。

‍

この良い例としては、米国の大手小売業者であるKrogerがあり、コンピュータービジョンとAIをセルフチェックアウトシステムに統合しています。リアルタイムのビデオ分析を使用することで、Krogerはチェックアウトエラーの75％以上を自動的に修正し、顧客体験と店舗運営の両方を改善することができました。

コンピュータビジョンを使用した品質検査

品質管理のために手動で製品を検査するのは時間がかかり、必ずしも正確ではありません。そのため、多くの製造業者が、コンピュータビジョンを使用して製造プロセスの早い段階で欠陥を検出する、画像検査ワークフローに切り替えています。

高解像度カメラとVision AIは、人間が見逃してしまうような小さな欠陥を発見することができ、YOLO11 ようなモデルは、完璧な製品だけが顧客に届くように、リアルタイムの品質チェック、選別、計数を支援することができる。このプロセスを自動化することで、時間の節約、コスト削減、無駄の削減が可能になり、生産がよりスムーズで効率的になります。

‍

主なポイント

リアルタイム推論は、AIモデルが瞬時に意思決定を行うのに役立ち、多くの業界で非常に重要です。自動運転車が事故を回避したり、医師が迅速に医療スキャンを分析したり、工場が製品の欠陥を検出したりするなど、高速かつ正確なAI応答は大きな違いをもたらします。

AIモデルの速度と効率を向上させることで、現実の状況でシームレスに動作する、よりスマートで信頼性の高いシステムを構築できます。テクノロジーの進歩に伴い、リアルタイムAIソリューションは今後も未来を形作り、日常のプロセスをより速く、より安全に、より効率的にしていきます。

詳細については、GitHubリポジトリにアクセスし、コミュニティにご参加ください。ソリューションページで、AIを活用した自動運転車や農業におけるコンピュータビジョンなどの分野におけるイノベーションをご覧ください。ライセンスオプションをご確認いただき、Vision AIプロジェクトを実現してください。

ビジョンAIソリューションにおけるリアルタイム推論が影響を与えています

AI推論とは？

推論エンジンの理解

推論レイテンシによって引き起こされる問題