半教師あり学習がラベル付けされたデータとラベル付けされていないデータをどのように組み合わせ、AIモデルを強化し、ラベル付けコストを削減し、精度を高めるかをご覧ください。
半教師あり学習(SSL)は、教師あり学習と 教師なし学習の中間に位置する機械学習(ML)手法の一種である。ラベル付けされた少量のデータとラベル付けされていない大量のデータを組み合わせてモデルを学習する。SSLの背景にある主な動機は、特に複雑なドメインにおいて、データのラベリングにしばしば伴う高いコストと労力である。容易に入手可能なラベルなしデータを活用することで、SSLは限られたラベル付きデータだけで達成できる以上のモデル性能と汎化を向上させることを目的としている。
半教師付き学習の核となる原理は、ラベル付けされていないデータは、明示的なラベルがないにもかかわらず、データの根本的な構造と分布に関する貴重な情報を含んでいるということである。SSLアルゴリズムは、学習プロセスを強化するためにこの構造を利用しようとする。一般的なアプローチでは、「クラスタ仮定」(同じクラスタ内の点は同じラベルを持つ可能性が高い)や「多様体仮定」(データ点は低次元の多様体上にある)など、データに関する仮定を行うことが多い。
SSLで使われるテクニックには、擬似ラベリングのような方法があり、最初のラベル付きデータで学習されたモデルが、ラベルなしデータのラベルを予測するのに使われる。信頼度の高い予測は「擬似ラベル」として扱われ、学習セットに追加される。別のアプローチとして、整合性正則化があり、これは、同じラベルなし入力の摂動バージョンに対してモデルが同様の出力を生成するように促すもので、多くの場合、データ増大のような手法によって達成される。これらの方法は、膨大なラベルなしデータセットを利用することで、モデルがよりロバストな特徴を学習するのを助ける。Towards Data ScienceにSSLの概要が掲載されている。
半教師付き学習は、ラベル付きデータの取得がボトルネックとなるシナリオで特に有用である。主な応用分野には以下のようなものがある:
半教師あり学習は、関連するMLパラダイムと区別することが重要である:
半教師あり学習は、効果的な人工知能(AI)システムを構築するための実用的で強力なアプローチを提供し、特にラベル付けされていない画像や動画が大量に存在する物体検出のようなコンピュータビジョンタスクにおいて有効です。Ultralytics HUBのようなプラットフォームは、以下のようなモデルをトレーニングするために、ラベル付けされたデータとラベル付けされていないデータが混在するデータセットの管理を容易にします。 Ultralytics YOLO.SSLに関するGoogle AI Blogの記事のようなリソースで強調されているように、SSLテクニックを探求することは、ラベル付きデータの利用可能性の制限に直面しているプロジェクトにとって非常に重要です。