対照学習は、機械学習における自己教師付き学習手法の一つであり、データサンプルを比較してその類似点と相違点を強調することにより、表現を学習することに焦点を当てている。これは、データを意味的な関係を捉えた意味のある埋め込みにエンコードすることを目的とする、表現学習のための強力なアプローチである。対比学習は、コンピュータビジョン、自然言語処理、音声処理などの領域での成功により、近年大きな支持を得ている。
対照学習は、データ・ポイントのペアを作り、それらを比較することによって行われる。これらのペアは通常次のように分類される:
この学習プロセスには対照的な損失関数が含まれ、この損失関数は、正のペアの表現間の(埋め込み空間における)距離を最小化する一方で、負のペアの表現間の距離を最大化するようにモデルを促す。一般的な対照的損失関数は、SimCLRやMoCoのようなモデルで重要な役割を果たすInfoNCE損失である。
コンピュータビジョンでは、コントラスト学習は、画像分類、物体検出、画像セグメンテーションなどのタスクのモデルを事前に学習するために広く使用されている。例えば
コンピュータ・ビジョンの応用の仕組みを探る』で、対比学習が現代のコンピュータ・ビジョンにどのように貢献しているかをご覧ください。
NLPでは、文の類似性、意味検索、テキスト分類などのタスクにおいて、テキスト埋め込みを整列させるために対照学習が使用されます。OpenAIのCLIPモデルは、画像とテキストの埋め込みを整列させるために対照学習法を統合し、ゼロショット画像分類のようなクロスモーダルアプリケーションを可能にします。
対照学習は音声データにも適用されている。例えば、同じオーディオファイルの異なるセグメント(正のペア)と、関係のないオーディオファイル(負のペア)を対比することで、ロバストなオーディオ表現を学習することができる。このアプローチは、音声認識や音楽分類のようなタスクに役立つ。
対照学習をサポートするツールやフレームワークがいくつかある:
コントラスト学習は、多様なアプリケーションで効率的かつ効果的な表現学習を可能にすることで、AIの進歩を促進し続けています。機械学習の概念をより深く知るには、Ultralytics 用語集で 機械学習(ML)と関連用語を検索してください。