バウンディングボックスが物体検出、AI、機械学習システムをどのように実現するかを学びます。コンピュータ・ビジョン・アプリケーションにおけるバウンディング・ボックスの役割を探ります!
バウンディングボックス(bounding box)とは、コンピュータビジョン(CV)において、画像やビデオフレーム内のオブジェクトの位置や範囲を示すために使用される矩形の枠のことである。バウンディングボックスは一般的に左上隅と右下隅の座標によって定義され、オブジェクトがどこにあり、どれだけの空間を占めるかを指定するシンプルで効果的な方法を提供します。バウンディングボックスは、物体検出、物体追跡、画像注釈など、様々なCVタスクの基本的な構成要素であり、現代の多くの人工知能(AI)や機械学習(ML)システムの基礎となっている。
バウンディングボックスは、物体検出モデルの学習と評価に不可欠である。以下のようなモデルが取り組むタスクでは Ultralytics YOLOのようなモデルによって取り組まれるタスクでは、バウンディングボックスは、学習中にグランドトゥルースとして機能し、物体の位置を正確に特定するようモデルに教えます。推論中、モデルは検出されたオブジェクトの周りのバウンディングボックスを予測します。このローカライゼーション能力は、自律走行車やロボットシステムなど、物体の識別だけでなく、その正確な位置を必要とするアプリケーションにとって極めて重要です。このプロセスは、多くの場合、CVATのようなツールを使って、人間や自動化ツールが学習画像中の物体の周囲にバウンディングボックスを描く、注意深いデータアノテーションから始まります。
MLモデルにおけるバウンディングボックスの使用と評価には、いくつかのメトリクスとテクニックが密接に関連している:
バウンディング・ボックスが長方形でオブジェクトを特定するのに対し、他のコンピュータ・ビジョン技術は異なる詳細レベルを提供する:
バウンディングボックスは、多くの実用的なAIアプリケーションに不可欠である:
自動運転車のAI開発において、バウンディングボックスは歩行者、自転車、他の車両、道路障害物の検出と追跡に不可欠です。バウンディングボックスを使用した正確でリアルタイムの物体検出により、車両システムは安全なナビゲーションと衝突回避のための情報に基づいた決定を下すことができ、米国道路交通安全局(NHTSA)などの組織が概説する安全ガイドラインを遵守することができます。自動運転車におけるAIの役割について、さらに詳しくご覧ください。
小売業では、バウンディングボックスを使った物体検出を利用して、棚を自動的に監視し、在庫を管理している。AIモデルを搭載したカメラは、商品を検出し、在庫レベルをカウントし、置き忘れた商品を特定し、商品と顧客のやり取りを追跡することができます。これにより効率が向上し、手作業が減り、店舗レイアウトや在庫補充を最適化するための貴重なデータが得られる。このような小売テクノロジーのトレンドに関する洞察は、この分野におけるAIの重要性の高まりを浮き彫りにしています。様々な業界向けのUltralytics ソリューションを見つけることができます。