バウンディング・ボックス
バウンディングボックスが物体検出、AI、機械学習システムをどのように実現するかを学びます。コンピュータ・ビジョン・アプリケーションにおけるバウンディング・ボックスの役割を探ります!
バウンディングボックスは、画像やビデオフレーム内のオブジェクトの位置を示すためにコンピュータビジョンで使用される矩形の注釈です。バウンディングボックスは物体検出の基本的な要素として機能し、物体の位置とスケールを定義するシンプルかつ効果的な方法を提供する。機械学習では、ラベル付けされたバウンディングボックスを持つ画像の大規模なデータセットでモデルを学習させ、オブジェクトを識別してローカライズする方法を学習させる。これらのモデルの出力には、ボックスの座標、クラスラベル(例:「車」、「人」)、モデルの予測の確実性を示す信頼度スコアが含まれます。
バウンディング・ボックスの仕組み
バウンディングボックスは通常、その位置とサイズを指定する座標セットによって定義されます。最も一般的な表現は
- 幅と高さを伴う左上座標(x, y, w, h):こ の書式は、 左上隅の x 座標 と y 座標を、 枠の幅 と 高 さ と と も に指定 し ます。
- コーナー点(x_min, y_min, x_max, y_max):この書式は、矩形の左上隅と右下隅の座標を定義します。
これらの座標はディープラーニングモデルの学習に使用され、ディープラーニングモデルは新しい未見の画像に対してこれらの値を予測することを学習する。予測されたバウンディングボックスの精度は、多くの場合、予測されたボックスとグラウンドトゥルースのボックスの重なりを測定するIntersection over Union(IoU)と呼ばれるメトリックを使用して評価される。Ultralytics YOLO11のような最新のオブジェクト検出モデルは、リアルタイムで正確なバウンディングボックスを生成するために高度に最適化されています。
バウンディング・ボックスの種類
バウンディング・ボックスには主に2つのタイプがある:
- 軸合わせバウンディングボックス:これは最も一般的なタイプで、矩形の辺が画像の水平軸と垂直軸に揃えられている。表現も処理も簡単ですが、回転していたり、不規則な形をしていたりするオブジェクトには効率が悪くなります。
- OBB(Oriented Bounding Box):このタイプのボックスには、回転のための追加パラメータが含まれており、傾いたオブジェクトをよりぴったりと囲むことができます。OBBは、衛星画像解析やドローンからの空撮画像など、対象物をさまざまな角度から見ることが多い特殊な用途で特に役立ちます。YOLO11のようなモデルは、このようなシナリオをより効果的に処理するために、指向オブジェクト検出をサポートしています。
他の概念との関係
バウンディングボックスは、他のコンピュータビジョンのタスクと密接に関連しているが、明確な目的を果たす。
- オブジェクト検出と画像セグメンテーションの比較:オブジェクト検出では、バウンディングボックスを使用してオブジェクトの位置を特定しますが、画像セグメンテーションでは、オブジェクトの形状をより詳細に理解することができます。たとえば、インスタンス・セグメンテーションは、単にオブジェクトの周囲に矩形を描くのではなく、それぞれの異なるオブジェクトの正確なピクセルレベルの境界を概説することで、さらに一歩進んだセグメンテーションを行います。これは、正確な形状情報を必要とするアプリケーションに便利です。詳細は、インスタンスセグメンテーションのガイドを参照してください。
- バウンディングボックス対アンカーボックス:アンカー・ベース検出器として知られるいくつかの物体検出モデルでは、「アンカー・ボックス」と呼ばれるあらかじめ定義されたボックスが、モデルが最終的なバウンディング・ボックスを予測するための参照として使われます。対照的に、アンカー・フリー検出器は、これらのプリセットなしで直接バウンディング・ボックスを予測し、しばしばモデル・アーキテクチャを単純化します。
実社会での応用
バウンディングボックスは、多くの実用的なAIアプリケーションに不可欠である:
- 自律走行車:自動運転車は、バウンディングボックスを使用して歩行者、他の車両、信号機を識別し、位置を特定するために、物体検出に大きく依存している。この空間認識は、多くの場合ディープラーニングモデルによって達成され、安全なナビゲーションに不可欠である。Waymoのような企業は、この技術を幅広く紹介している。Ultralyticsは、自動運転車のAIに関する洞察を提供しています。
- リテール・アナリティクス:小売業では、バウンディングボックスは、棚上の商品を検出し、在庫レベルを監視し、足の往来パターン(オブジェクト・カウント)を通じて顧客の行動を分析することで、AI主導の在庫管理に役立ちます。
- セキュリティと監視バウンディングボックスは、自動化された監視システムがリアルタイムで個人や物体を検出・追跡し、不審な行動に対して警告を発することを可能にします。これは、セキュリティアラームシステムのようなアプリケーションを構築するための基礎となります。
- 医療画像解析:ヘルスケアでは、バウンディングボックスは、スキャン画像内の腫瘍のような潜在的な異常を強調表示することにより、臨床医を支援し、より迅速な診断に役立ちます。この例は放射線学でご覧いただけます:人工知能の研究や医療画像解析のページでご覧いただけます。
- 農業バウンディング・ボックスは、農業におけるコンピュータ・ビジョンのブログで詳しく説明しているように、収穫のための果物の識別、作物の健康状態の監視、害虫の検出などの作業に精密農業で使用されている。