用語集

対照学習

コントラスト学習:ロバストでデータ効率に優れた埋め込みにより、視覚、NLP、音声タスクに優れた自己教師付きAI技術を発見。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

対照学習は、機械学習における自己教師付き学習手法の一つであり、データサンプルを比較してその類似点と相違点を強調することにより、表現を学習することに焦点を当てている。これは、データを意味的な関係を捉えた意味のある埋め込みにエンコードすることを目的とする、表現学習のための強力なアプローチである。対比学習は、コンピュータビジョン、自然言語処理、音声処理などの領域での成功により、近年大きな支持を得ている。

対照学習の仕組み

対照学習は、データ・ポイントのペアを作り、それらを比較することによって行われる。これらのペアは通常次のように分類される:

  • 正のペア:意味的に類似しているデータポイント(例えば、同じオブジェクトの異なるビュー)。
  • 負のペア:意味的に異なるデータポイント。

この学習プロセスには対照的な損失関数が含まれ、この損失関数は、正のペアの表現間の(埋め込み空間における)距離を最小化する一方で、負のペアの表現間の距離を最大化するようにモデルを促す。一般的な対照的損失関数は、SimCLRやMoCoのようなモデルで重要な役割を果たすInfoNCE損失である。

対照学習の主な利点

  1. データ効率:対照学習はラベル付けされていないデータを活用するため、大規模なラベル付きデータセットへの依存を減らすことができる。これは、医療画像や科学研究のように、データのラベリングに費用や時間がかかる分野で特に有用である。
  2. 表現の改善:対照学習によって学習された埋め込みは、多くの場合、分類やクラスタリングのような様々な下流のタスクに渡ってよく汎化される。
  3. 汎用性:このアプローチは、画像、テキスト、音声、さらにはマルチモーダルデータなど、多様なモダリティに適用できる。

対照学習の応用

ビジョンAIと画像認識

コンピュータビジョンでは、コントラスト学習は、画像分類、物体検出、画像セグメンテーションなどのタスクのモデルを事前に学習するために広く使用されている。例えば

  • SimCLR(Simple Framework for Contrastive Learning of Visual Representations):SimCLRはデータ増強技術を応用して正対を生成し、対比的損失を用いて視覚表現を学習する。
  • Ultralytics YOLO:主に物体検出で知られているが、Ultralytics YOLO のようなモデルは、画像認識やセグメンテーションのようなタスクのパフォーマンスを向上させるために、事前に訓練されたコントラスト学習埋め込みから利益を得ることができる。

コンピュータ・ビジョンの応用の仕組みを探る』で、対比学習が現代のコンピュータ・ビジョンにどのように貢献しているかをご覧ください。

自然言語処理

NLPでは、文の類似性、意味検索、テキスト分類などのタスクにおいて、テキスト埋め込みを整列させるために対照学習が使用されます。OpenAIのCLIPモデルは、画像とテキストの埋め込みを整列させるために対照学習法を統合し、ゼロショット画像分類のようなクロスモーダルアプリケーションを可能にします。

オーディオと音声処理

対照学習は音声データにも適用されている。例えば、同じオーディオファイルの異なるセグメント(正のペア)と、関係のないオーディオファイル(負のペア)を対比することで、ロバストなオーディオ表現を学習することができる。このアプローチは、音声認識や音楽分類のようなタスクに役立つ。

実例

  1. ヘルスケアコントラスト学習は、ヘルスケアにおけるAIを変革している。例えば、大規模なラベル付きデータセットを必要とせずにX線やMRIのロバストな表現を学習することで、医療画像解析に役立つ。これらの埋め込みは、異常検出や病気の診断に役立ちます。
  2. 自律走行車自動運転技術において、コントラスト学習はセンサーデータ(LiDARやカメラなど)を整列させ、自動運転におけるAIを向上させる表現を学習するために使用される。これにより、物体認識や環境マッピングなどのタスクが強化される。

対照学習と関連概念

  • 教師あり学習:ラベル付けされたデータに依存する教師あり学習とは異なり、対照学習はラベル付けされていないデータを使用し、データポイント間の関係を通じて学習することに焦点を当てる。
  • 自己教師あり学習:対照学習は自己教師あり学習のサブセットで、モデルがデータ内の変換や関係を予測することを学習する。
  • 埋め込み:埋め込みは多くの機械学習技術の産物であるが、対照学習は特に意味的関係を保持するために埋め込みを最適化する。

ツールとフレームワーク

対照学習をサポートするツールやフレームワークがいくつかある:

  • PyTorch( PyTorch について詳しくはこちら):対比的損失を実装し、カスタムモデルを構築するためのライブラリを提供する。
  • Ultralytics HUB(DiscoverUltralytics HUB):シームレスなモデルトレーニングとデプロイメントを提供し、コントラスト学習技術をビジョンAIのワークフローに統合することができる。

コントラスト学習は、多様なアプリケーションで効率的かつ効果的な表現学習を可能にすることで、AIの進歩を促進し続けています。機械学習の概念をより深く知るには、Ultralytics 用語集で 機械学習(ML)と関連用語を検索してください。

すべて読む