用語集

データ補強

データ増強で機械学習モデルを強化します。精度を高め、オーバーフィッティングを減らし、ロバスト性を向上させるテクニックを発見してください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

データ増強とは、機械学習において、既存のデータを改変したものを作成することで、学習データセットのサイズを人為的に拡大する手法である。このプロセスでは、画像の回転、反転、拡大縮小、切り抜きなど、様々な変換を元のデータに適用する。学習データの多様性を高めることで、データ増強は機械学習モデルの汎化能力を向上させ、よりロバストでオーバーフィッティングを起こしにくくする。オーバーフィッティングは、モデルがノイズや異常値を含む学習データを学習しすぎることで発生する。

データ補強のメリット

データ増強にはいくつかの重要な利点がある。第一に、トレーニング中にモデルをより幅広いバリエーションにさらすことで、オーバーフィッティングを抑えることができる。これにより、モデルは訓練データの特定の特徴に影響されにくくなり、新しい未知のデータに対してより汎化できるようになります。第二に、特に元のデータセットが小さい場合や多様性に欠ける場合に、モデルの精度と性能を向上させることができる。より多くの訓練例を作成することで、データ増強はモデルにデータ中の基本的なパターンを学習する機会を提供する。最後に、モデルのロバスト性を向上させ、照明、方向、背景ノイズの変化など、入力データの変化に強くすることができます。

一般的なデータ補強テクニック

特にコンピュータビジョンのタスクでは、データ補強のためにいくつかの一般的な技術が使用されている:

  • 幾何学変換:回転、平行移動、拡大縮小、剪断、反転などの操作が含まれる。例えば、画像を数度回転させたり、水平方向に反転させたりすることで、新しい有効なトレーニング例を作成することができます。
  • 色空間の変換:画像の明るさ、コントラスト、彩度、色相を調整することで、さまざまな照明条件をシミュレートし、さまざまな環境でのモデルの汎化能力を向上させることができる。
  • カーネルフィルター:画像をシャープにしたりぼかしたりするフィルタを適用することで、これらの変化に影響されない特徴を学習することができる。
  • ランダム消去:画像の一部をランダムにマスキングすることで、オクルージョンやオブジェクトの欠落に対してよりロバストなモデルを作成することができます。
  • 画像の混合:MixUpやCutMixのような技術は、画像とそれに対応するラベルをブレンドして新しい学習例を作成する。例えば、MixUpは画像とラベルの両方を線形補間する。

コンピュータ・ビジョンにおけるデータ補強

コンピュータ・ビジョンでは、データ補強は、モデルが遭遇する可能性のある実世界のシナリオを幅広くシミュレートできるため、特に有用である。例えば物体検出では、Ultralytics YOLO YOLO がページ上で初めて言及されたとき、オーグメンテーションされた画像で学習されたモデルは、その向き、大きさ、照明条件に関係なく物体を検出することを学習することができる。これは、モデルが多様で予測不可能な条件下で確実に動作しなければならない、自律走行車のようなアプリケーションにとって極めて重要です。例えば、歩行者や車両の画像に、回転、拡大縮小、ノイズの追加などの様々な変換を適用することで、自律走行システムは、実世界の様々なシナリオにおいて、これらの物体を正確に検出するように学習することができる。同様に、画像分類では、異なる色調整で画像を補強することで、モデルが異なる照明条件に対してより良く汎化できるようになります。

他領域におけるデータ補強

データ補強はコンピュータビジョンで広く使われているが、自然言語処理(NLP)や音声処理など他の領域でも応用できる。NLPでは、同義語の置換、逆翻訳、単語のランダムな挿入/削除などの技術によって、テキストデータを拡張することができる。音声処理では、バックグラウンドノイズを追加したり、ピッチを変えたり、音声をタイムストレッチしたりすることで、多様な学習例を作成することができる。

実世界での応用

  • ヘルスケア 医用画像解析では、限られた数の医用画像でモデルを学習させるためにデータ補強を使用することができる。例えば、MRIスキャンに回転、反転、小さな変形を適用することで、モデルは異なる患者や撮影条件にわたってより正確に異常を検出することを学習することができる。
  • 農業データ増強は、様々な条件下で撮影された画像から植物の病気や害虫を検出するモデルを訓練するのに役立ちます。異なる照明、アングル、ズームレベルの作物画像を補強することで、モデルは現場でしっかりと機能し、農家が早期に問題を特定して是正措置を講じるのに役立ちます。

データ補強とその他のテクニック

データ補強を他の関連技術と区別することは重要である:

  • データの前処理:データ増強とデータ前処理はどちらもモデル学習用のデータを準備するものだが、前処理には通常、正規化、標準化、欠損値の処理などのステップが含まれる。これらのステップは、データがモデルに適した形式であることを保証するために不可欠である。一方、データ増強は、学習データの多様性を高めることに重点を置く。
  • 合成データの生成合成データは、多くの場合、Generative Adversarial Networks(GAN)のような生成モデルを使用して、まったく新しいデータポイントを作成する。これは既存のデータを修正するデータ増強とは異なる。合成データは、医療や金融のアプリケーションなど、実データが乏しい場合や機密性が高い場合に特に有用です。

ツールとライブラリ

いくつかのツールやライブラリがデータ拡張をサポートしている。Python では、OpenCVTensorFlowのようなライブラリは、画像変換のための幅広い関数を提供している。さらに、Albumentationsのような特化したライブラリは、高度に最適化された多様なオーグメンテーションパイプラインを提供する。Ultralytics HUBはデータ補強のためのツールも提供しており、これらのテクニックをモデル学習プロセスに簡単に統合することができます。MixUp、Mosaic、Random Perspectiveのようなデータ補強テクニックを使って、モデルトレーニングを強化しましょう。

すべて読む