IoU(Intersection over Union)とは何か、どのように計算されるのか、そして物体検出とAIモデル評価における重要な役割について学びます。
IoU(Intersection over Union)は、コンピュータビジョン(CV)、特に物体検出タスクで用いられる基本的な評価指標である。これは、モデルによって生成された予測バウンディングボックスと、手作業でラベル付けされた正しい輪郭であるグランドトゥルースバウンディングボックスという2つの境界の重なりを測定します。結果として得られるスコアは0から1の間の値で、モデルが画像内のオブジェクトをどれだけ正確に位置決めしたかを定量化します。スコア1は完全一致を表し、スコア0は重なりが全くないことを表す。この指標は、Ultralytics YOLO11のようなモデルのローカライゼーション精度を評価する上で非常に重要です。
IoUの核心は、予測されたバウンディングボックスとグラウンドトゥルースのバウンディングボックスのユニオン(両ボックスに覆われた総面積)に対する交差点(重なり面積)の比率を計算する。重なり合う2つの正方形を想像してほしい。交差点」は、それらが重なる共有領域である。ユニオン」とは、両方の正方形を合わせた総面積のことで、重なり合う部分は一度だけ数える。IoUは、交差を結合で割ることで、予測されたボックスが実際のオブジェクトとどれだけ整合しているかを標準化した尺度を提供する。この単純だが強力な概念は、物体検出のための最新のディープラーニング(DL)の基礎となっている。
IoUを使う上で重要なのは、"IoUしきい値 "を設定することだ。この閾値は、予測が正しいかどうかを判断する、あらかじめ定義された値(例えば0.5)である。予測されたボックスのIoUスコアがこの閾値以上であれば、それは "true positive "に分類される。スコアが下回れば "偽陽性 "となる。この閾値はPrecisionや Recallのような他の性能指標に直接影響し、COCOのようなベンチマーク・データセット上で物体検出モデルを評価するための標準指標である平均平均精度(mAP)を計算する上で重要な要素です。
IoUは、数え切れないほどのAIシステムのパフォーマンスを検証するために不可欠である。以下はその一例である:
IoUは単なる評価指標ではなく、学習プロセス自体にも不可欠です。Ultralytics YOLOv8やYOLO11を含む多くの最新の物体検出アーキテクチャは、IoUやそのバリエーションを損失関数に直接使用しています。一般化IoU(GIoU)、距離IoU(DIoU)、完全IoU(CIoU)など、これらの高度なIoUベースの損失は、モデルがうまく重なるだけでなく、中心間の距離やアスペクト比の一貫性などの要素も考慮したバウンディングボックスを予測することを学習するのに役立ちます。これにより、従来の回帰損失と比較して、収束が速くなり、ローカリゼーションのパフォーマンスが向上します。異なるYOLOモデル間の詳細な比較は、ドキュメントでご覧いただけます。
モデルのトレーニングや ハイパーパラメータのチューニング中にIoUをモニタリングすることで、開発者はより良いローカライゼーションのためにモデルを改良することができます。Ultralytics HUBのようなツールは、IoUやその他のメトリクスを追跡し、モデルの改善サイクルを効率化します。その広範な有用性にもかかわらず、標準的なIoUは、特にオーバーラップしていないボックスに対して鈍感な場合があります。この制限のために、前述のIoUバリアントが開発されました。それにもかかわらず、IoUは依然としてコンピュータビジョン評価の基礎となっている。
IoUは不可欠だが、他の指標との関係を理解することが重要だ: