用語集

教師なし学習

教師なし学習が、クラスタリング、次元削減、異常検知を使用して、どのようにデータの隠れたパターンを発見するかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

教師なし学習とは、機械学習の一種で、アルゴリズムがラベル付けされていないデータから学習するものである。モデルを訓練するためにラベル付けされたデータに依存する教師あり学習とは異なり、教師なし学習アルゴリズムはデータを探索し、明示的なガイダンスなしにパターンを特定する。このアプローチは、ラベル付けが現実的でない大規模なデータセットを扱う場合や、データ内の隠れた構造や関係を発見することを目的とする場合に特に有用である。

教師なし学習の仕組み

教師なし学習では、アルゴリズムは対応する出力ラベルのない入力データを提示される。そしてシステムは、データ固有の構造を学習しようとする。これは、以下を目的とする様々な手法によって達成される:

  • データをクラスタ化する:類似したデータ点をグループ化する。K平均クラスタリングはこのための一般的なアルゴリズムで、特徴の類似性に基づいてデータを異なるクラスタに分割する。
  • 次元を減らす:重要な情報を保持したまま変数の数を減らし、データを単純化する。主成分分析(PCA)は次元削減の一般的な手法で、高次元のデータを低次元の表現に変換する。
  • 関連性を発見する:データ内の変数間の関係や依存関係を特定する。例えば、アソシエーション・ルール・マイニングは、頻度の高い共起パターンを記述するルールを発見することができる。
  • 異常検知:標準から大きく逸脱した異常なデータ点を特定する。DBSCAN (Density-Based Spatial Clustering of Applications with Noise)を使用して、データ空間内の疎な領域を認識することにより異常値を特定することができる。

教師なし学習の応用

教師なし学習技術は、データから価値ある洞察を引き出すために、さまざまな分野で使用されている:

  • 顧客セグメンテーション:企業はクラスタリング・アルゴリズムを使って、購買行動、人口統計、ウェブサイトのアクティビティに基づいて、顧客を明確なグループにセグメント化する。これにより、ターゲットを絞ったマーケティング戦略やパーソナライズされた顧客体験が可能になる。例えば、小売企業は、顧客の取引データを教師なし学習で学習し、異なる顧客セグメントを識別することで、商品の推奨やプロモーションを調整することができる。
  • 不正検知における異常検知:金融において、異常検知は不正取引を特定するために極めて重要である。教師なし学習アルゴリズムは、通常の取引パターンを学習し、不正行為を示す可能性のある逸脱にフラグを立てることができる。これにより、金銭的損失を未然に防ぎ、データ・セキュリティを強化することができます。
  • 医用画像解析:教師なし学習は、医療画像解析において重要な役割を果たす。次元削減やクラスタリングのような技術は、X線やMRIのような医療画像を分析し、明示的なラベルがなくても、病気や異常を示すかもしれないパターンを検出するのに役立ちます。
  • 文書クラスタリング:自然言語処理では、教師なし学習が文書クラスタリングに使われ、内容に基づいて類似文書をグループ化する。これは、ニュース記事や研究論文のような大量のテキスト・データを整理したり、トピック・モデリングやセマンティック検索のようなタスクに役立つ。

教師なし学習と教師あり学習の比較

教師なし学習と教師あり学習の主な違いは、学習に使われるデータの種類にある。教師あり学習では、各入力データが対応する出力ラベルと対になっているラベル付きデータを使用する。アルゴリズムは、これらのラベル付けされた例に基づいて、入力と出力の対応付けを学習する。対照的に、教師なし学習はラベルのないデータを使用し、明示的な出力ラベルを持たずに、データ自体に隠れた構造やパターンを発見することを目的とする。

教師あり学習と教師なし学習は、どちらも機械学習(ML)や人工知能(AI)において不可欠なツールであり、そのどちらを選択するかは、特定の問題、ラベル付けされたデータの入手可能性、そして望ましい結果によって決まる。モデルを含むプロジェクトでは Ultralytics YOLOモデルを含むプロジェクトでは、トレーニングは通常、オブジェクト検出や 画像セグメンテーションのようなタスクのための教師あり学習に依存しますが、教師なし手法は、データの前処理、探索的データ分析、または製造品質管理における異常検出のような特定のアプリケーションで価値があります。

すべて読む