ゼロショット学習:未知のデータを分類するモデルを可能にし、物体検出やNLPなどに革命をもたらす最先端のAIアプローチをご覧ください。
ゼロショット学習(ZSL)は、機械学習(ML)の中の魅力的な分野であり、学習段階で明示的に見たことのないデータカテゴリーを認識・分類するようにモデルを学習する。可能性のある全てのカテゴリーについてラベル付けされた例を必要とする伝統的な教師あり学習アプローチとは異なり、ZSLは、共有された補助情報を用いて、見たことのあるクラスから見たことのないクラスへと知識を汎化することを目的としている。この能力は、考えられる全てのカテゴリーについてラベル付けされたデータを取得することが現実的でない、あるいは不可能な実世界のシナリオにおいて特に価値がある。
ZSLの中核となる考え方は、入力特徴空間(例えば画像特徴やテキスト特徴)と意味的埋め込み空間との間のマッピングを学習することである。この意味空間は通常、見たクラスと見たことのないクラスの両方で共有される高レベルの記述的特性や属性を符号化する。例えば、コンピュータビジョンでは、「縞模様がある」、「毛皮がある」、「翼がある」といった視覚的属性や、テキストベースの記述がこれにあたる。自然言語処理(NLP)では、単語埋め込みがこの意味空間として機能することが多い。
学習中、モデルは見たクラスの特徴を、対応する意味表現(属性や埋め込みなど)と関連付けることを学習する。推論時に、未見のクラスのインスタンスが提示されると、モデルはその特徴を抽出し、学習された意味空間にマッピングする。このマッピングを(別途提供される)未見のクラスの既知の意味表現と比較することで、モデルは事前の例なしでもクラスラベルを予測することができる。ディープラーニングモデル、特にCLIPのような対比学習のような技術を使用したモデルは、豊富な特徴表現を学習する能力があるため、ZSLタスクに採用されることが多い。Ultralytics Datasetsのドキュメントに記載されているような、このようなタスクに適した様々なデータセットを調べることができます。
ゼロ・ショット・ラーニングは、さまざまな領域にわたる強力なアプリケーションを可能にする:
ZSLを関連概念と区別することは重要だ:
主な違いは、ZSLは訓練や適応の間、対象クラスに対してラベル付けされた例がゼロであるという厳密な条件の下で動作することである。比較の概要については、Few-Shot、Zero-Shot、Transfer Learningの理解を参照。
ゼロショット学習は、AIシステムのスケーラビリティと適応性を大幅に向上させる。大規模なMLアプリケーションの開発においてしばしばボトルネックとなる、徹底的なデータ収集とアノテーションへの依存を軽減する。モデルが未知の概念について推論することを可能にすることで、ZSLは人工知能(AI)における汎化の限界を押し広げ、システムをより堅牢にし、現実世界のオープンエンドな性質に対応できるようにします。Ultralytics HUBのようなプラットフォームは、将来的にZSLの原理を活用する可能性のあるモデルを含め、モデルの訓練と展開を容易にします。ZSL研究の詳細については、ウィキペディアのZSLページや、arXivなどのプラットフォームにある学術調査などのリソースを参照してください。