用語集

ゼロ・ショット・ラーニング

ゼロショット学習:未知のデータを分類するモデルを可能にし、物体検出やNLPなどに革命をもたらす最先端のAIアプローチをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ゼロショット学習(ZSL)は、機械学習(ML)の中の魅力的な分野であり、学習段階で明示的に見たことのないデータカテゴリーを認識・分類するようにモデルを学習する。可能性のある全てのカテゴリーについてラベル付けされた例を必要とする伝統的な教師あり学習アプローチとは異なり、ZSLは、共有された補助情報を用いて、見たことのあるクラスから見たことのないクラスへと知識を汎化することを目的としている。この能力は、考えられる全てのカテゴリーについてラベル付けされたデータを取得することが現実的でない、あるいは不可能な実世界のシナリオにおいて特に価値がある。

ゼロ・ショット・ラーニングの仕組み

ZSLの中核となる考え方は、入力特徴空間(例えば画像特徴やテキスト特徴)と意味的埋め込み空間との間のマッピングを学習することである。この意味空間は通常、見たクラスと見たことのないクラスの両方で共有される高レベルの記述的特性や属性を符号化する。例えば、コンピュータビジョンでは、「縞模様がある」、「毛皮がある」、「翼がある」といった視覚的属性や、テキストベースの記述がこれにあたる。自然言語処理(NLP)では、単語埋め込みがこの意味空間として機能することが多い。

学習中、モデルは見たクラスの特徴を、対応する意味表現(属性や埋め込みなど)と関連付けることを学習する。推論時に、未見のクラスのインスタンスが提示されると、モデルはその特徴を抽出し、学習された意味空間にマッピングする。このマッピングを(別途提供される)未見のクラスの既知の意味表現と比較することで、モデルは事前の例なしでもクラスラベルを予測することができる。ディープラーニングモデル、特にCLIPのような対比学習のような技術を使用したモデルは、豊富な特徴表現を学習する能力があるため、ZSLタスクに採用されることが多い。Ultralytics Datasetsのドキュメントに記載されているような、このようなタスクに適した様々なデータセットを調べることができます。

実世界での応用

ゼロ・ショット・ラーニングは、さまざまな領域にわたる強力なアプリケーションを可能にする:

  1. 新しい物体認識: 画像分類や 物体検出において、ZSL はシステムが最初の学習データには存在しない物体を識別することを可能にする。例えば、一般的な動物について訓練された野生動物監視システムは、専門家によって提供されたテキスト記述や一連の意味属性に基づいて、希少種や新しく発見された種を識別できる可能性がある。Ultralytics YOLOようなモデルは、オープン語彙検出のためにこの機能を活用します。
  2. 動的なコンテンツ分類:ZSLは、文書、ニュース記事、ユーザーが作成したコンテンツを、事前にラベル付けされたデータが存在しない新たなトピックに分類することができる。システムは既存のカテゴリで学習され、単語埋め込みやトピック記述を使用して、予期せぬイベントやトレンドに関連するコンテンツを分類することができる。

ZSLと関連する学習パラダイムとの比較

ZSLを関連概念と区別することは重要だ:

  • 数ショット学習非常に少数のラベル付き例(ゼロ以上)から新しいクラスを学習することを目的とする。
  • ワンショット学習数ショット学習の特殊なケースで、新しいクラスごとに1つのラベル付き例しか利用できない。
  • 転移学習あるタスクや領域で得た知識を活用して、関連する別のタスクや領域のパフォーマンスを向上させること。多くの場合、事前に訓練されたモデルをターゲットデータ(通常はターゲットクラスの例を含む)で微調整する

主な違いは、ZSLは訓練や適応の間、対象クラスに対してラベル付けされた例がゼロであるという厳密な条件の下で動作することである。比較の概要については、Few-Shot、Zero-Shot、Transfer Learningの理解を参照。

AIにおける重要性

ゼロショット学習は、AIシステムのスケーラビリティと適応性を大幅に向上させる。大規模なMLアプリケーションの開発においてしばしばボトルネックとなる、徹底的なデータ収集とアノテーションへの依存を軽減する。モデルが未知の概念について推論することを可能にすることで、ZSLは人工知能(AI)における汎化の限界を押し広げ、システムをより堅牢にし、現実世界のオープンエンドな性質に対応できるようにします。Ultralytics HUBのようなプラットフォームは、将来的にZSLの原理を活用する可能性のあるモデルを含め、モデルの訓練と展開を容易にします。ZSL研究の詳細については、ウィキペディアのZSLページやarXivなどのプラットフォームにある学術調査などのリソースを参照してください。

すべて読む