教師なし学習が、クラスタリング、次元削減、異常検知を使用して、どのようにデータの隠れたパターンを発見するかをご覧ください。
教師なし学習は機械学習(ML)の一種で、アルゴリズムがラベルのないデータからパターンを学習する。事前に定義されたラベルや「正しい答え」に依存する教師あり学習とは異なり、教師なし学習はデータ固有の構造を探索し、事前のガイダンスなしに隠れた関係、グループ化、異常を発見する。このアプローチは人工知能(AI)において、ラベル付けが現実的でない、あるいは不可能な複雑なデータセットの初期データ探索や理解に特に有用である。これにより、モデルはデータから直接パターンや洞察を発見することができる。
教師なし学習の主な目的は、データ内の根本的な構造や分布をモデル化し、そのデータについてより深く学ぶことである。アルゴリズムは、類似点、相違点、構造を自ら発見するように任されている。一般的な手法には以下のようなものがある:
教師なし学習技術は、特に大量のラベルなしデータを扱う場合に、様々な実世界のシナリオで採用されている:
教師なし学習は、ビッグデータの特徴である、ラベル付けされていない膨大な量の生データの意味を理解する上で重要な役割を果たす。教師なし学習は、しばしばデータの前処理と 特徴工学の重要なステップとして機能し、他のML技術を適用する前に隠れた構造を発見したり、データの複雑さを軽減したりするのに役立ちます。Ultralytics YOLO ようなモデルは、主にオブジェクト検出などのタスクに対して教師ありの手法で学習されますが、教師なしの手法でデータ構造を理解することは、データセットの準備と分析を大幅に支援し、モデルのパフォーマンスを向上させる可能性があります。データセットを準備するためのデータ収集とアノテーションガイドを調べたり、Ultralytics HUBのようなプラットフォームを使ってデータとモデルを管理することができます。
教師なし学習を、関連するディープラーニング(DL)やMLパラダイムと区別することは重要である:
教師なし学習は依然としてMLの基本的な分野であり、ラベルが乏しい、あるいは利用できない複雑なデータセットにおける発見と理解を促進する。