用語集

オーバーフィット

機械学習におけるオーバーフィッティングを特定、防止、対処する方法を学ぶ。モデルの汎化と実世界のパフォーマンスを向上させるテクニックを発見します。

オーバーフィッティングとは、機械学習（ML）における基本的な概念であり、モデルが学習データの詳細やノイズを学習し、それが新しい未知のデータに対するモデルの性能に悪影響を与える場合に発生する。要するに、モデルは基本的なパターンを学習する代わりに、訓練セットを記憶してしまうのだ。この結果、モデルは訓練されたデータでは高い精度を達成しますが、実世界のデータには汎化できず、実用的なアプリケーションでは信頼できないものになります。優れた汎化を達成することは、AI開発における主要な目標である。

オーバーフィッティングの見分け方

オーバーフィッティングは、通常、訓練データセットと別の検証データセットの両方でモデルのパフォーマンスを監視することによって識別される。オーバーフィッティングの一般的な兆候は、訓練セットの損失関数の値が減少し続ける一方で、検証セットの損失が増加し始める場合です。同様に、トレーニングの精度が向上し続けているにもかかわらず、検証の精度が停滞したり、その後のエポックで悪化したりする場合は、モデルがオーバーフィットしている可能性が高い。TensorBoardのようなツールは、これらのメトリクスを視覚化し、早期にそのような問題を診断するのに優れています。Ultralytics HUBのようなプラットフォームも、実験を追跡し、オーバーフィッティングを検出するモデルを評価するのに役立ちます。

オーバーフィッティングとアンダーフィッティング

オーバーフィッティングとアンダーフィッティングは、機械学習における2つの一般的な問題であり、モデルが汎化できないことを表している。これらは本質的に正反対の問題である。

オーバーフィット：モデルがデータに対して複雑すぎる（分散が大きい）。学習データのノイズやランダムな変動を捕捉し、学習時のパフォーマンスは優れているが、テストデータでのパフォーマンスは低い。
アンダーフィット：モデルが単純すぎて、データの根本的な構造を捉えることができない（バイアスが高い）。関連するパターンを学習できないため、訓練データとテストデータの両方でパフォーマンスが低い。

ディープラーニングにおける課題は、適切なバランスを見つけることであり、これはしばしばバイアスと分散のトレードオフで表現される概念である。