用語集

教師なし学習

教師なし学習が、クラスタリング、次元削減、異常検知を使用して、どのようにデータの隠れたパターンを発見するかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

教師なし学習は機械学習(ML)の一種で、アルゴリズムがラベルのないデータからパターンを学習する。事前に定義されたラベルや「正しい答え」に依存する教師あり学習とは異なり、教師なし学習はデータ固有の構造を探索し、事前のガイダンスなしに隠れた関係、グループ化、異常を発見する。このアプローチは人工知能(AI)において、ラベル付けが現実的でない、あるいは不可能な複雑なデータセットの初期データ探索や理解に特に有用である。これにより、モデルはデータから直接パターンや洞察を発見することができる。

教師なし学習の仕組み

教師なし学習の主な目的は、データ内の根本的な構造や分布をモデル化し、そのデータについてより深く学ぶことである。アルゴリズムは、類似点、相違点、構造を自ら発見するように任されている。一般的な手法には以下のようなものがある:

  • クラスタリングこれは、特定の特徴に基づいて、類似したデータポイントを自動的にグループ化することを含む。一般的なアルゴリズムにはK-Means Clusteringや DBSCANがある。
  • 次元削減この手法は、重要な情報を保持したまま、入力変数や特徴の数を減らしてデータを単純化する。主成分分析(PCA)は、次元削減のために広く使用されている手法である。
  • アソシエーション・ルール学習この方法は、大規模なデータセットの変数間の興味深い関係や関連ルールを発見する。よく一緒に購入される商品を見つけるマーケットバスケット分析によく適用される。

教師なし学習の応用

教師なし学習技術は、特に大量のラベルなしデータを扱う場合に、様々な実世界のシナリオで採用されている:

  • 顧客セグメンテーション:企業はクラスタリングを利用して、類似した行動、嗜好、または人口統計を持つ顧客をグループ化します。これにより、より効果的なターゲットマーケティングキャンペーンやパーソナライズされた顧客体験が可能になります。顧客セグメンテーションの詳細については、こちらをご覧ください。
  • 異常値の検出教師なしアルゴリズムは、標準から大きく逸脱した異常なデータポイントや異常値を識別することに優れている。これは、金融における不正検出、ネットワーク侵入の検出、製造における欠陥の特定などのアプリケーションに不可欠です。

AIとMLにおける関連性

教師なし学習は、ビッグデータの特徴である、ラベル付けされていない膨大な量の生データの意味を理解する上で重要な役割を果たす。教師なし学習は、しばしばデータの前処理と 特徴工学の重要なステップとして機能し、他のML技術を適用する前に隠れた構造を発見したり、データの複雑さを軽減したりするのに役立ちます。Ultralytics YOLO ようなモデルは、主にオブジェクト検出などのタスクに対して教師ありの手法で学習されますが、教師なしの手法でデータ構造を理解することは、データセットの準備と分析を大幅に支援し、モデルのパフォーマンスを向上させる可能性があります。データセットを準備するためのデータ収集とアノテーションガイドを調べたり、Ultralytics HUBのようなプラットフォームを使ってデータとモデルを管理することができます。

教師なし学習と他の学習タイプとの比較

教師なし学習を、関連するディープラーニング(DL)やMLパラダイムと区別することは重要である:

  • 教師あり学習完全にラベル付けされたデータセットを必要とする。つまり、各データ・ポイントには既知の出力またはカテゴリーがある。目標は、ラベル付けされた例に基づいて、新しい未知のデータポイントの出力を正確に予測できるモデルを訓練することである。
  • 教師なし学習教師なし学習の一種とされることが多く、事前のタスク(例えば画像の隠れた部分を予測する)を作成することで、入力データそのものからラベルを自動的に生成する。Transformerアーキテクチャーに基づくものを含め、大規模なモデルの事前学習に広く使われている。
  • 半教師あり学習少量のラベル付きデータと大量のラベルなしデータを組み合わせて使用する。このアプローチは、ラベル付けされていないデータを活用することで、限られたラベル付きデータのみでは不可能な学習精度の向上を目指す。半教師あり学習についてさらに調べる

教師なし学習は依然としてMLの基本的な分野であり、ラベルが乏しい、あるいは利用できない複雑なデータセットにおける発見と理解を促進する。

すべて読む