機械学習におけるオーバーフィッティングとは、モデルが学習データをうまく学習しすぎて、根本的なパターンの代わりにノイズやランダムな揺らぎを捉えてしまうことである。これにより、訓練データセットでは優れた性能を発揮するが、新しい未知のデータへの汎化がうまくいかなくなる。基本的に、モデルは複雑になりすぎ、トレーニングデータに合わせてしまい、概念を理解する代わりに答えを記憶するようになってしまう。これはAIモデルのトレーニングにおいてよくある課題であり、特に物体検出や画像セグメンテーションのようなタスクにUltralytics YOLO 、ニューラルネットワークのような複雑なアルゴリズムが使われる。
機械学習モデルは、学習データの誤差を最小化することを目的としているため、オーバーフィッティングが発生する。しかし、モデルが過度に複雑であれば、学習セットに存在するノイズさえも適合させてしまう。このノイズは真のパターンを表しておらず、新しいデータセットでは変化する。特定の日に、ある人の正確な寸法に合わせてスーツを完璧に仕立てるようなものだと考えてほしい。その人の体重が変動したり、他の人が着ようとしたりすると、うまくフィットしないかもしれない。機械学習では、学習データでのこの「完璧なフィット」が、実世界のデータでは柔軟性を欠き、パフォーマンスを低下させる。
オーバーフィッティングの反対はアンダーフィッティングで、モデルが単純すぎてデータの根本的な構造を捉えることができない。アンダーフィッティングのモデルは、学習が十分でないため、トレーニングデータでも新しいデータでもパフォーマンスが低下する。目標は、よくバイアスと分散のトレードオフと呼ばれるバランスを見つけることであり、うまく汎化するモデルを作ることである。
医療画像解析:疾患検出のための医用画像解析において、オーバーフィットモデルは、それがトレーニングされた特定の画像セットの疾患を識別することに非常に優れ、そのデータセットにのみ存在するユニークなアーチファクトやノイズを認識する可能性さえある。しかし、異なる機械や患者集団から得られた新しい医用画像を提示された場合、モデルは一般化できず、実臨床において不正確な診断につながる可能性がある。例えば、MRIスキャンを使用して腫瘍を検出するように訓練されたモデルは、特定のMRIスキャナーの特性に過剰に適合してしまい、たとえ根本的な病理が同じであっても、異なるスキャナーからのスキャンではパフォーマンスが低下する可能性がある。
センチメント分析:顧客レビューを肯定的か否定的かに分類するようにトレーニングされたセンチメント分析モデルを考えてみましょう。過剰にフィットさせると、モデルはトレーニングのレビューデータセットで広く使われている特定の単語やフレーズに過度に敏感になる可能性があります。例えば、トレーニングデータが特定の製品の特徴に言及したレビューを多く含む場合、新しいレビューの文脈が異なっていても、モデルはその特徴の単なる存在を肯定的なセンチメントと誤って関連付けるかもしれません。これは、同じような言語を使用しているが、異なる意見を表現している新しい顧客のフィードバックを誤って分類することにつながります。
オーバーフィッティングを軽減するのに役立つテクニックがいくつかある:
オーバーフィッティングを理解し対処することで、開発者は様々なアプリケーションのために、より信頼性が高く効果的なAIモデルを構築することができ、トレーニング環境以外の実世界のシナリオでも優れたパフォーマンスを発揮できるようになります。Ultralytics HUBのようなツールは、実験追跡とモデル評価を支援し、モデル開発プロセスにおけるオーバーフィッティングの検出と緩和を支援します。