用語集

半教師付き学習

半教師あり学習がラベル付けされたデータとラベル付けされていないデータをどのように組み合わせ、AIモデルを強化し、ラベル付けコストを削減し、精度を高めるかをご覧ください。

半教師あり学習(SSL)は、教師あり学習と 教師なし学習のギャップを埋める機械学習(ML)手法である。学習精度を向上させるために、大量のラベルなしデータとともに少量のラベル付きデータを活用する。実世界の多くのシナリオでは、ラベルなしデータの取得は安価だが、データのラベル付けプロセスにはコストと時間がかかる。SSLは、ラベル付けされていない膨大な例から学習できるようにすることで、この課題に対処する。このアプローチは、モデルが高い性能を達成するために膨大なデータセットを必要とするディープラーニング(DL)において特に威力を発揮する。

半教師付き学習の仕組み

SSLの中核となる考え方は、ラベル付きデータを使って初期モデルを構築し、このモデルを使ってラベルなしデータの予測を行うことである。モデルの最も確信度の高い予測は「擬似ラベル」として扱われ、トレーニングセットに加えられる。そしてモデルは、元のラベルと信頼度の高い擬似ラベルの組み合わせで再トレーニングされる。この反復プロセスにより、モデルは、ラベル付けされた小さな部分だけでなく、データセット全体の根本的な構造を学習することができる。

一般的なSSL技術には以下のようなものがある:

  • 一貫性正則化:この方法は、入力データにわずかな摂動が加えられても、モデルの予測は一貫性を保つべきであるという考え方を強制する。例えば、わずかなデータ増大がある画像は、同じ分類をもたらすはずです。
  • 生成モデル: Generative Adversarial Networks (GANs)のような技術は、真のデータ分布に似たデータを生成するように学習することができ、クラス間の判断境界をより明確にするのに役立つ。
  • グラフベースの手法:これらの手法は、データ点をグラフ内のノードとして表現し、ラベル付けされたノードからラベル付けされていないノードへ、それらの近接性または類似性に基づいてラベルを伝播する。技術的な概要は、学術的な調査に記載されている

実世界での応用

SSLは、ラベリングがボトルネックとなるドメインで高い効果を発揮する。2つの顕著な例がある:

  1. 医療画像解析 腫瘍検出のためにMRIやCTのような医療スキャンにラベルを付けるには、専門の放射線科医が必要で、非常に高価です。SSLを使用すると、数百のラベル付きスキャンでモデルを学習し、病院のアーカイブから数千のラベルなしスキャンを使用してモデルを改良することができます。これにより、手作業を大幅に減らしながら、ロバストな画像分類と セグメンテーションモデルを開発することができる。
  2. ウェブコンテンツとドキュメントの分類何十億ものウェブページ、ニュース記事、カスタマーレビューを手作業で分類することは現実的ではありません。SSLは、手作業で分類された小さな文書セットを使って、最初のテキスト分類器を学習させることができる。その後、このモデルは、ラベル付けされていない膨大なドキュメントのコーパスを分類し、センチメント分析やトピック分類のようなタスクのために、時間とともに改善される独自の予測を使用します。

他の学習パラダイムとの比較

SSLを関連する人工知能(AI)の概念と区別することは重要だ:

  • 自己教師あり学習(SSL)同じ頭字語だが、自己教師あり学習は異なる。これは教師なし学習の一種であり、ラベルは事前のタスク(例:文中のマスクされた単語の予測)を通じてデータ自体から生成される。半教師あり学習では、モデルの学習プロセスを導くために、少量の明示的にラベル付けされたデータセットが必要になる。
  • アクティブ・ラーニングこの手法もラベル付けコストの削減を目的としている。しかし、ラベル付けされていないデータをすべて使用するのではなく、能動学習モデルは最も情報量の多いデータ点にラベル付けするよう、人間の注釈者にインテリジェントに問い合わせる。対照的に、SSLは通常、学習中に人間が直接関与することなく、ラベル付けされていないデータを利用する。
  • 転移学習これは、(ImageNetのような)大規模なデータセットで事前に訓練されたモデルを使用し、より小規模でタスク固有のデータセットで微調整を行う。どちらも既存の知識を活用するが、SSLは対象タスクのラベルなしデータそのものから学習するのに対し、転移学習は別の(多くの場合関連する)タスクの知識を活用する。

ツールとトレーニング

PyTorch(PyTorch公式サイト)やTensorFlow(TensorFlow公式サイト)を含む多くの最新のディープラーニング(DL)フレームワークは、SSLアルゴリズムを実装するための機能を提供しているか、適応することができる。Scikit-learnのようなライブラリは、いくつかのSSLメソッドを提供しているUltralytics HUBのようなプラットフォームは、ラベル付けされたデータとラベル付けされていないデータが混在している可能性のあるデータセットの管理を容易にすることで、プロセスを合理化し、そのようなデータ構造を活用するように設計されたモデルのトレーニングと 展開を簡素化する。SSLの研究は進化し続けており、NeurIPSや ICMLのような主要なAIカンファレンスでしばしば発表されています。

Ultralyticsコミュニティに参加する

AIの未来に参加しませんか。世界のイノベーターとつながり、協力し、成長する

今すぐ参加する
クリップボードにコピーされたリンク