グリーンチェック
クリップボードにコピーされたリンク

数発学習、ゼロ発学習、転移学習を理解する

コンピュータビジョンにおける数ショット学習、ゼロショット学習、転移学習の違いや、これらのパラダイムがAIモデルのトレーニングをどのように形成しているかを探る。

人工知能(AI)システムは、顔の認識、画像の分類、自動車の運転といった複雑なタスクを、最小限の人間の入力で処理することができる。AIはデータを研究し、パターンを認識し、そのパターンを使って予測や決定を下すことでこれを行う。AIの進歩に伴い、AIモデルが学習、適応し、驚くべき効率でタスクを実行する方法がますます洗練されてきている。

例えば、コンピュータ・ビジョンはAIの一分野であり、機械が世界からの視覚情報を解釈し理解できるようにすることに焦点を当てている。従来のコンピュータ・ビジョンのモデル開発は、トレーニング用の大規模な注釈付きデータセットに大きく依存している。このようなデータの収集とラベリングには時間とコストがかかる。 

このような課題に対処するために、研究者たちは、限られた例から学習する少数ショット学習(FSL)、未見のオブジェクトを識別するゼロショット学習(ZSL)、事前に訓練されたモデルの知識を新しいタスクに適用する転移学習(TL)のような革新的なアプローチを導入してきた。

この記事では、これらの学習パラダイムがどのように機能するのか、その主な違いを明らかにし、実際の応用例を見ていこう。始めよう!

学習パラダイムの概要

コンピュータ・ビジョンに関して、数ショット学習、ゼロショット学習、転移学習とは何か、そしてそれらがどのように機能するのかを探ってみよう。 

数ショット学習

数ショット学習とは、システムが少数の例を用いて新しい物体を認識することを学習する方法である。例えば、モデルにペンギン、ペリカン、パフィンの写真を数枚見せると(この小さなグループを「サポートセット」と呼ぶ)、これらの鳥がどのように見えるかを学習する。 

その後、ペンギンのような新しい絵をモデルに見せると、この新しい絵をサポートセットにある絵と比較し、最も近いものを選ぶ。大量のデータを収集するのが困難な場合、システムがわずかな例で学習し適応することができるため、この方法は有益である。

図1.数発学習の仕組みの概要。

ゼロショット学習

ゼロショット学習とは、機械が見たことのないものを、その例を必要とせずに認識する方法である。説明文のような意味的な情報を使って、つながりを作る手助けをする。

例えば、「小さくてふわふわしている」、「大きな野生の猫」、「長い顔」といった特徴を理解することで、猫やライオン、馬といった動物について学習した機械があれば、その知識を使って虎のような新しい動物を識別することができる。たとえトラを見たことがなくても、「黒い縞模様のあるライオンのような動物」というような説明で正しく識別することができる。これによって、機械は多くの例を必要とすることなく、学習と適応が容易になる。

図2.ゼロショット学習は記述を使って新しいオブジェクトを識別する。

トランスファー学習

転移学習とは、モデルがあるタスクから学んだことを、類似した新しいタスクの解決に役立てるという学習パラダイムである。このテクニックは、物体検出、画像分類、パターン認識といったコンピュータ・ビジョンのタスクで特に有用である。 

例えば、コンピュータ・ビジョンでは、事前に訓練されたモデルは、動物のような一般的な物体を認識し、その後、異なる犬種のような特定の物体を識別するために、転移学習によって微調整することができる。以前のタスクで得た知識を再利用することで、転移学習は、より少ないデータセットでコンピュータビジョンモデルを訓練することを容易にし、時間と労力を節約する。

図3.転移学習の仕組みの概要。

どのようなモデルが転移学習をサポートしているのか気になるかもしれません。 Ultralytics YOLO11は、このようなことができるコンピュータ・ビジョン・モデルの素晴らしい例です。これは最先端の物体検出モデルで、まず大規模で一般的なデータセットで事前学習されます。その後、特定のタスクに特化した小規模なデータセットで微調整し、カスタムトレーニングすることができます。

学習パラダイムの比較

さて、ここまで数発学習、ゼロ発学習、転移学習について説明してきたが、これらの違いを比較してみよう。

図4.数発学習、ゼロ発学習、転移学習の主な違い 画像は筆者撮影。

数ショット学習は、ラベル付けされたデータが少量しかない場合に有効だ。AIモデルがわずかな例から学習することが可能になる。一方、ゼロショット学習は、ラベル付きデータを必要としない。その代わり、システムが新しいタスクに対応できるよう、説明や文脈を利用する。一方、転移学習は、事前に訓練されたモデルの知識を使用することで、最小限の追加データで新しいタスクに素早く適応できるようにするという、異なるアプローチを取る。各手法は、扱うデータやタスクの種類によって、それぞれの強みがある。

様々な学習パラダイムの実社会への応用

これらの学習パラダイムは、すでに多くの分野で変化をもたらし、革新的なソリューションで複雑な問題を解決している。実社会でどのように応用できるのか、詳しく見てみよう。

少数ショット学習による希少疾患の診断

数ショット学習は、ヘルスケア分野、特に医療画像診断において、画期的なものである。大量のデータを必要とすることなく、わずかな例や説明を用いて、医師が希少疾患を診断するのに役立つ。これはデータが限られている場合に特に有効で、稀な疾患について大規模なデータセットを収集することは困難な場合が多いからだ。

例えば、SHEPHERDは、希少な遺伝子疾患を診断するために、少数点学習と生物医学的知識グラフを使用している。症状や検査結果などの患者情報を、既知の遺伝子や疾患のネットワークにマッピングする。これにより、データが限られている場合でも、遺伝的原因と思われる疾患を特定し、類似の症例を見つけることができる。 

図5.シェパード・モデルは最小限のデータで希少疾患を診断する。

ゼロショット学習による植物病害検出の改善

農業では、植物病害を迅速に特定することが不可欠である。発見が遅れると、作物への被害が拡大し、収量が減少し、経済的損失が大きくなるからである。従来の方法では、大規模なデータセットと専門家の知識に頼ることが多く、特に遠隔地や資源が限られた地域では、必ずしもアクセスできるとは限らない。そこで、ゼロショット学習のようなAIの進歩が威力を発揮する。

農家がトマトやジャガイモを栽培していて、葉が黄色くなったり茶色い斑点が出たりするような症状に気づいたとしよう。ゼロショット学習は、大規模なデータセットを必要とせずに、晩枯病のような病気を特定するのに役立つ。症状の説明を使用することで、モデルは見たことのない病気を分類することができる。このアプローチは高速でスケーラブルであり、農家は植物の様々な問題を検出することができる。作物の健康状態をより効率的に監視し、タイムリーな対策を講じ、損失を削減するのに役立つ。

図6. ゼロショット学習による植物病害の特定。

自律走行車と転移学習

自律走行車は安全に航行するために、しばしば異なる環境に適応する必要がある。トランスファー学習は、ゼロからトレーニングを開始することなく、新しい状況に素早く適応するために予備知識を使用するのに役立つ。車両が視覚情報を解釈するのを助けるコンピューター・ビジョンと組み合わせることで、これらのテクノロジーは、異なる地形や気象条件下でのスムーズなナビゲーションを可能にし、自律走行をより効率的で信頼性の高いものにする。

その良い例が、Ultralytics YOLO11 駐車スペースを監視する駐車場管理システムだ。YOLO1111は、事前に訓練された物体検出モデルであり、リアルタイムで駐車場の空車と満車を識別するために、伝達学習を使って微調整することができます。駐車場画像の少ないデータセットでモデルをトレーニングすることで、空きスペース、満車スポット、予約エリアさえも正確に検出することを学習します。

図7.Ultralytics YOLO11使用した駐車場管理。

他のテクノロジーと統合されたこのシステムは、ドライバーを最も近い空きスポットへ誘導し、検索時間と交通渋滞の軽減に貢献する。トランスファー学習は、YOLO11既存の物体検出機能をベースとすることでこれを可能にし、ゼロから始めることなく駐車場管理の特定のニーズに適応することを可能にする。このアプローチにより、時間とリソースを節約しながら、駐車場運営を改善し、全体的なユーザーエクスペリエンスを向上させる、非常に効率的でスケーラブルなソリューションを生み出すことができる。

学習パラダイムの新たな傾向

コンピュータ・ビジョンにおける学習パラダイムの未来は、よりインテリジェントで持続可能なビジョンAIシステムの開発に傾いている。特に、少数ショット学習、ゼロショット学習、転移学習を組み合わせたハイブリッド・アプローチの利用が増加傾向にある。これらの手法の長所を融合させることで、モデルは最小限のデータで新しいタスクを学習し、その知識をさまざまな分野に応用することができる。

興味深い例としては、適応されたディープエンベディングを使用して、以前のタスクと少量の新しいデータからの知識を使用してモデルを微調整することで、限られたデータセットでの作業を容易にしている。 

同様に、Xショット学習は、さまざまなデータ量のタスクを扱うように設計されている。弱い監視を使用し、モデルが限られた、あるいはノイズの多いラベルから学習し、明確な指示を与えることで、事前の例がほとんどない、あるいはまったくない場合でも、モデルが迅速に適応できるようにする。これらのハイブリッド・アプローチは、異なる学習方法を統合することで、AIシステムがより効果的に課題に取り組むことができることを示している。

要点

少数ショット学習、ゼロショット学習、転移学習はそれぞれ、コンピュータ・ビジョンにおける特定の課題に対処するもので、異なるタスクに適している。適切なアプローチは、特定のアプリケーションと利用可能なデータの量に依存する。例えば、少数ショット学習は限られたデータでうまく機能し、ゼロショット学習は未見のクラスや見慣れないクラスを扱うのに適している。

今後は、これらの手法を組み合わせて、視覚、言語、音声を統合したハイブリッドモデルを作ることが、重要な焦点になりそうだ。これらの進歩は、AIシステムをより柔軟かつ効率的にし、複雑な問題にも対応できるようにすることを目的としており、この分野におけるイノベーションの新たな可能性を開くものである。

私たちのコミュニティに参加し、GitHubリポジトリをチェックすることで、AIについてより詳しく調べることができます。自動運転車や 農業におけるコンピュータービジョンの AIが、どのように未来を再構築しているのかを学びましょう。YOLO ライセンスの利用可能なオプションをチェックして始めましょう!

Facebookのロゴツイッターのロゴリンクトインのロゴコピー・リンク・シンボル

このカテゴリの続きを読む

AIの未来
を一緒に作りましょう!

機械学習の未来への旅を始めよう