専門家による特徴エンジニアリングで機械学習の精度を向上させます。インパクトのある特徴量を作成、変換、選択するテクニックを学びます。
フィーチャーエンジニアリングは、機械学習(ML)モデルにより適したものにするために、生データからフィーチャーを選択、変換、作成する重要なプロセスです。フィーチャーエンジニアリングは、ドメインの知識とデータ分析テクニックを使用して、根本的な問題をよりよく表現する入力を作成し、最終的にモデルのパフォーマンス、精度、解釈可能性を向上させます。最も熟練したシェフ(またはモデル)であっても、質の悪い材料(トレーニングデータ)では苦労する。このステップは、しばしばMLワークフローの中で最も重要で時間のかかる部分の一つと考えられています。
実世界から収集された生データが、MLアルゴリズムで直接使用できる状態にあることは稀である。欠損値、矛盾、無関係な情報が含まれていたり、モデル消費に適さない形式(テキストやカテゴリーデータなど)であったりするかもしれません。フィーチャーエンジニアリングはこのような問題に対処する:
フィーチャーエンジニアリングの傘下にはいくつかのテクニックがある:
同じ意味で使われることも多いが、特徴工学と特徴抽出にはそれぞれ異なるニュアンスがある。
要するに、特徴抽出は、特徴工学の広範なプロセスの中で使用されるツールであることが多い。
のような先進的なモデルがある一方で Ultralytics YOLOのような先進的なモデルは、ディープ・ニューラル・ネットワーク・アーキテクチャ(バックボーン、ネック、ヘッド)を通じて関連する視覚的特徴を自動的に学習することにより、物体検出や 画像セグメンテーションなどのタスクを得意としているが、特徴工学の原則は依然として関連している。例えば、YOLO モデルに入力する前に、入力画像を前処理(例えば、様々な照明のためのヒストグラム均等化、OpenCVのようなライブラリを使用したノイズ除去、または問題ドメインに合わせた特定のデータ補強の適用)することは、ロバスト性とモデル性能を向上させることができる特徴工学の一形態です。さらに、YOLO 出力(バウンディングボックス座標、オブジェクトクラス、カウントなど)は、下流のタスクのためのフィーチャーに設計したり、より複雑な分析のために他のデータソースと組み合わせたりすることができますUltralytics モデルの使用方法、カスタムトレーニング、アノテーションデータの前処理については、Ultralytics ドキュメントや チュートリアルを参照してください。Featuretoolsのようなツールは、Automated Machine Learning(AutoML)の概念に沿ったフィーチャーエンジニアリングプロセスの自動化を支援することもできます。効果的なフィーチャーエンジニアリングは、強力なディープラーニングモデルと並んで、MLOpsを成功させるための重要な要素です。