IoU(Intersection over Union)とは何か、どのように計算されるのか、そして物体検出とAIモデル評価における重要な役割について学びます。
IoU(Intersection over Union)は、コンピュータビジョン、特に物体検出や 画像セグメンテーションのようなタスクで広く使用される基本的なメトリックである。これは、予測された境界(物体検出におけるバウンディングボックスのようなもの)が、実際の真実の物体の境界とどれだけ正確に一致するかを定量化するものである。基本的に、IoUは予測された領域と真の領域との重なりの度合いを測定し、ローカライゼーションのパフォーマンスに対するシンプルかつ効果的なスコアを提供します。IoUを理解することは、コンピュータビジョンモデルの有効性を評価・比較するために不可欠です。
IoUは、次のようなモデルがどの程度優れているかを評価する際に、重要な性能指標となる。 Ultralytics YOLOのようなモデルが、画像内のオブジェクトの位置をどの程度特定できるかを評価する際に、重要な性能指標となる。分類はどのような物体が存在するかを教えてくれますが、IoUはモデルがその物体の位置をどれだけ正確に特定したかを教えてくれます。この空間精度は、正確な位置特定が正しい分類と同じくらい重要である多くの実世界のシナリオで不可欠です。IoUスコアが高いということは、モデルの予測が実際の物体境界と密接に一致していることを示します。COCOデータセットの評価や古いPASCAL VOCチャレンジのような多くの物体検出ベンチマークは、IoUしきい値に大きく依存しています。
この計算では、予測されたバウンディングボックスとグラウンドトゥルースのバウンディングボックスが重なる部分(交点)を、両方のボックスがカバーする総面積(和)で割ります。この比率の結果、0から1の間のスコアが得られます。1のスコアは完全な一致を意味し、予測されたボックスがグランドトゥルースと完全に重なることを意味します。スコア0は、全く重なっていないことを示します。多くのオブジェクト検出評価プロトコルで一般的に行われているのは、IoUスコアがある閾値(多くの場合0.5)を満たすか超える場合に、予測が正しいとみなすことです。
IoUの定位精度を測定する能力は、さまざまな領域で不可欠なものとなっている:
IoUは特にローカリゼーションの品質を測定しますが、パフォーマンスを完全に把握するために他のメトリクスと一緒に使用されることもよくあります。平均平均精度(mAP)は、さまざまなIoUのしきい値にわたって精度(ポジティブな予測の精度)とリコール(すべての関連するインスタンスを見つける能力)の両方を考慮する、広く使用されているメトリックです。個々の予測を評価するIoUとは異なり、mAPは異なるクラスとしきい値にわたるスコアの集計を提供し、モデルの品質のより広範な評価を提供します。これらのメトリクスについては、YOLO パフォーマンス・メトリクス・ガイドをご覧ください。精度と想起の関係を理解することが、mAPを解釈する鍵です。
IoUは単なる評価指標ではなく、トレーニングプロセスそのものに不可欠なものでもある。例えば、IoU計算はしばしば損失関数(GIoU、DIoU、CIoU損失など)の中で使用され、正確なバウンディングボックスを予測するモデルの能力を直接最適化します。トレーニングやハイパーパラメータのチューニング中にIoUをモニタリングすることで、開発者はより良いローカライゼーションのためにモデルを改良することができます。Ultralytics HUBのようなツールは、IoUやその他のメトリクスを追跡し、モデルの改善サイクルを効率化します。その有用性にもかかわらず、IoUはオブジェクトのスケールや小さな位置誤差に敏感である可能性がありますが、コンピュータ・ビジョン評価の基礎であることに変わりはありません。