教師なし学習が、クラスタリング、次元削減、異常検知を使用して、どのようにデータの隠れたパターンを発見するかをご覧ください。
教師なし学習は機械学習(ML)のカテゴリーであり、あらかじめ定義されたラベルやカテゴリーを持たないデータに対してアルゴリズムを学習する。教師あり学習とは異なり、入力特徴に基づいて既知の出力を予測することが目的ではない。その代わりに、システムはデータ内の基本的な構造、パターン、関係を自ら学習しようとする。これは、コンピュータに分類されていないアイテムの大規模なコレクションを与え、何を探すべきか指示せずに、自然なグループ分けや興味深い特徴を見つけるように求めるようなものだ。このアプローチは、複雑なデータセットを探索し、事前には明らかでないかもしれない洞察を発見するために極めて重要であり、現代の人工知能(AI)の重要な部分を形成している。
教師なし学習では、アルゴリズムは入力データ点を調べ、それらの間の類似性、相違性、相関性を識別しようとする。訓練段階では、「正解」や目標出力は提供されない。アルゴリズムはデータに内在する構造を推測しなければならない。これには多くの場合、データポイントをグループに整理したり(クラスタリング)、データの複雑さを軽減したり(次元削減)、異常なデータポイントを特定したり(異常検出)することが含まれる。教師なし手法の成功は、多くの場合、アルゴリズムが外部からのガイダンスなしにデータセットの本質的な特性をどれだけ捉えられるかにかかっている。
教師なし学習にはいくつかのテクニックがある:
教師なし学習は、様々な分野にわたって様々な応用力を持つ:
教師なし学習は、他のMLアプローチとは大きく異なる:
教師なし学習は、データを探索し、隠れた構造を発見し、貴重な特徴を抽出するための強力なツールであり、多くの場合、複雑なデータ分析パイプラインの重要な最初のステップとして、または他のML技術を補完する役割を果たします。Ultralytics HUBのようなプラットフォームは、データ準備や分析のための教師なし技術を組み込む可能性のある様々なMLモデルを開発・管理できる環境を提供します。以下のようなフレームワーク PyTorchや TensorFlowなどのフレームワークは、教師なしアルゴリズムの実装をサポートする広範なライブラリを提供する。