Few-Shot学習は、機械学習(ML)のサブフィールドであり、非常に少数の学習例(通常、1クラスあたり1~5例)からモデルを学習し、汎化することに焦点を当てている。これは、従来のディープラーニング(DL)アプローチが、高い性能を達成するために数千から数百万のラベル付きデータポイントを必要とすることが多いのとは対照的である。核となる考え方は、多くの場合、大規模で多様なデータセットでの訓練から得られる事前知識を活用し、最小限の新しいデータで新しいタスクやクラスに素早く適応することである。このため、大量のラベル付きデータを収集することが非現実的、高価、または時間のかかる状況において、特に有用である。
コア・コンセプト
フューショット・ラーニングには、しばしば次のようなコンセプトが含まれる:
- サポートセット:新しいタスクやクラスに提供される、ラベル付けされた例の小さなセット。
- クエリーセット:サポートセットに基づいてモデルが分類する必要のあるラベルのない例。
- メタ学習:しばしば「学習するための学習」と呼ばれるメタ学習技術は、メタ学習段階でモデルを様々な学習タスクで学習させる。これにより、モデルは効率的な学習アルゴリズムを自ら学習することができ、その後、わずかな例を使って新しいタスクに素早く適応させることができる。一般的なアプローチには、マッチング・ネットワークや プロトタイプ・ネットワークがある。
関連性と応用
限られたデータから学習する能力により、Few-Shot Learningは様々な領域で大いに役立つ:
- 医療画像解析:少数の患者スキャンしかトレーニングに利用できないような希少疾患の診断。例えば、特定の希少な腫瘍タイプの例が乏しい場合に、医療画像における腫瘍検出モデルをトレーニングする。
- ロボット工学:ロボットに新しいスキルや物体認識能力を最小限のデモンストレーションで教えることで、新しい環境への展開を加速させる。例えば、ロボットに新しい物体を数回見せただけで、それを手に取るように訓練することができる。
- パーソナライゼーション: 推薦システムやユーザーインターフェースのようなモデルを、非常に限られたインタラクションデータに基づいて個人の好みに合わせること。
- コンピュータビジョン:大規模なデータ収集やアノテーションを必要とせず、画像分類や新しいオブジェクトカテゴリーのオブジェクト検出などのタスクを可能にする。Ultralytics HUBのようなプラットフォームはモデルのトレーニングを容易にすることができ、数ショット技術はカスタムタスクに必要なデータを削減できる可能性がある。
関連概念
Few-Shot学習は、限られたデータを扱う学習パラダイムの一部である:
- ゼロショット学習:通常、クラスの説明や属性のような補助的な情報を活用することで、モデルは学習中に一度も見たことのないクラスを認識しなければならない。
- ワンショット学習:Few-Shot学習の特定のケースで、新しいクラスごとに1つのラベル付き例のみが提供される。
- 転移学習:大規模なデータセット(ImageNetなど)で事前に訓練されたモデルを、関連する新しいタスクに適応(微調整)させる、より広範な手法。Few-Shot学習の基礎として使用されることが多いが、従来の転移学習では、効果的な適応のために、ほんの一握りの例以上を必要とすることがある。次のような事前学習済みモデル Ultralytics YOLOのような事前学習済みモデルは、物体検出における転移学習の出発点としてよく使用される。Ultralytics ドキュメントで、モデルのトレーニングと適応に関するガイドを調べることができます。
Few-Shotラーニングは、よりデータ効率が高く、適応力のある人工知能(AI)システムに向けた重要な一歩である。