用語集

特徴抽出

Ultralytics YOLO11 で機械学習における特徴抽出のパワーを発見。効率的な検出と分析のテクニックを学ぶ。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

特徴抽出は、機械学習(ML)やコンピュータビジョンにおける基本的なプロセスであり、生の、しばしば複雑なデータと、そこから学習するように設計されたアルゴリズムとの間の重要な橋渡しの役割を果たす。画像やテキストのような構造化されていないデータや高次元のデータを、元のデータの重要な特徴を効果的に表す数値特徴(特徴ベクトル)の構造化された集合に変換する。主な目的は、データの複雑さを軽減し(次元削減)、関連するパターンを強調し、ノイズや冗長な情報を除去し、最終的にデータをMLモデルにより適したものにすることで、パフォーマンスの向上、学習時間の短縮、汎化の改善につながります。

特徴抽出の仕組み

特徴抽出の方法はデータの種類によって異なる。画像の場合、OpenCVのようなライブラリで利用可能なアルゴリズムを使用して、エッジ、コーナー、テクスチャ、カラーヒストグラムを識別するテクニックが含まれるかもしれない。最新のディープラーニング、特に以下のようなモデルで使用されるCNN(Convolutional Neural Networks)では、特徴抽出の手法が異なります。 Ultralytics YOLO特徴抽出はしばしば自動的に学習される。ネットワークの畳み込み層は入力にフィルタを適用し、単純なテクスチャからオブジェクトの部分まで、階層的に複雑なパターンを捉える特徴マップを作成する。自然言語処理(NLP)のテキストデータの場合、抽出には、用語頻度TF)を計算したり、単語の埋め込み(単語の意味と関係を表す密なベクトル)を生成したりすることが含まれる。その他、様々なデータタイプに適用可能な次元削減の一般的な手法として、主成分分析(PCA)やt-分散確率的近傍埋め込み(t-SNE)などがある。

特徴抽出と特徴エンジニアリングの比較

関連はあるが、特徴抽出は特徴工学とは異なる。特徴抽出は、特に生データを特徴に変換することに重点を置き、多くの場合、確立されたアルゴリズムや自動学習(CNNなど)を使用する。特徴工学は、特徴抽出を包含する広範な用語であるが、既存の特徴から新しい特徴を作成すること、最も関連性の高い特徴を選択すること、ドメインの専門知識とモデル要件に基づいて特徴を変換することも含まれる。ディープラーニングモデルは、画像認識や 物体検出のようなタスクの特徴抽出部分を大幅に自動化し、従来のMLで一般的だった手作業による特徴工作の必要性を減らしている。

実世界での応用

特徴抽出は、数え切れないほどのAIアプリケーションに不可欠である:

  1. 医療画像解析:腫瘍検出のためにMRIやCTスキャンを分析する際、特徴抽出は、異常の兆候を示す関連するパターン、テクスチャ、形状を識別し、正常組織と区別するのに役立ちます。以下のようなモデル YOLOv8のようなモデルは、抽出された特徴が腫瘍領域を識別する鍵となる脳腫瘍のようなデータセットで学習させることができる。
  2. センチメント分析:顧客レビューのセンチメント(肯定的、否定的、中立的)を判断するために、NLP特徴抽出はテキストを意味的な意味を捉える数値表現(埋め込みなど)に変換し、モデルがセンチメントを効果的に分類できるようにします。センチメント分析のユースケースの詳細をご覧ください。

ロバストで効率的なAIシステムを構築するためには、効果的な特徴抽出が不可欠です。Ultralytics HUBのようなプラットフォームは、検出から画像セグメンテーションに至るまで、強力な特徴抽出を本質的に実行するモデルのトレーニングプロセスを合理化します。データの品質を確保するために、適切なデータ前処理が特徴抽出に先行することがよくあります。

すべて読む