用語集

特徴量エンジニアリング

特徴量エンジニアリングを活用してモデルの性能を向上させましょう。スケーリングや拡張といった手法を学び、Ultralytics 精度を高める最適化を実現します。

特徴量エンジニアリングとは、生データを機械学習モデルの性能を向上させる意味のある入力値へ変換するプロセスである。これはドメイン知識を活用し、アルゴリズムがデータ内のパターンをより良く理解するのに役立つ変数（特徴量と呼ばれる）を選択・修正・新規作成することを含む。畳み込みニューラルネットワーク（CNN）などの現代的な深層学習アーキテクチャは特徴を自動学習できるものの、明示的な特徴量設計は多くのワークフローにおいて依然として重要なステップである。特に構造化データを扱う場合や、エッジデバイスでのモデル効率を最適化しようとする場合に顕著だ。入力データを精緻化することで、開発者はより単純なモデルで高い精度を達成できることが多く、膨大な計算リソースの必要性を低減できる。

AIにおける特徴量エンジニアリングの役割

人工知能（AI）の文脈において、生データは即座に処理できる状態にあることは稀である。画像はサイズ変更が必要かもしれないし、テキストはトークン化を必要とするかもしれない。また、表形式のデータにはしばしば欠損値や無関係な列が含まれている。特徴量エンジニアリングは、生情報とアルゴリズムが要求する数学的表現との間のギャップを埋める。効果的な特徴量設計は、モデルが取りこぼす可能性のある重要な関係を浮き彫りにできる。例えば「距離」と「時間」を組み合わせて「速度」という特徴量を作成するといった手法だ。このプロセスはデータ前処理と密接に関連しているが、前処理がクリーニングやフォーマットに焦点を当てるのに対し、特徴量設計は予測力を高めるための創造的な強化を目的とする。

コンピュータビジョンタスクにおいて、特徴量設計は大きく進化した。従来の手法では、エッジやコーナーを識別するためにスケール不変特徴変換（SIFT）のような記述子を手作業で作成する必要があった。現在では、YOLO26のような深層学習モデルが内部の隠れ層において自動的な特徴抽出を実行する。しかし、合成データの生成やモザイク・ミックスアップといったデータ拡張技術の適用など、トレーニング中にモデルがより頑健な特徴の変異に晒されるようデータセットを準備する工程において、エンジニアリングは依然として重要な役割を担っている。

一般的な技術と応用

特徴量エンジニアリングは、特定の問題とデータタイプに合わせて調整された幅広い戦略を包含する。

次元削減： 主成分分析（PCA）などの手法は、重要な情報を保持しながら変数の数を削減し、高次元データセットにおける過学習を防止する。
カテゴリ変数の符号化：アルゴリズムは通常、数値入力を必要とします。ワンホット符号化などの手法は、カテゴリラベル（例：「赤」、「青」）をモデルが処理可能な二値ベクトルに変換します。
正規化とスケーリング：特徴量を標準範囲にスケーリングすることで、より大きな値を持つ変数（住宅価格など）が、より小さな範囲の変数（部屋数など）を支配しないようにします。これはニューラルネットワークにおける勾配ベースの最適化において極めて重要です。
ビンニングと離散化：連続値をビン（例：年齢層）にグループ化することで、モデルは外れ値をより効果的に処理し、非線形関係を捉えることができる。

実世界の例

特徴量工学は様々な産業分野で複雑な問題を解決するために適用される。

製造業における予知保全： スマート製造では、センサーが機械から生の振動・温度データを収集する。エンジニアは温度の「変化率」や振動強度の「移動平均」を表す特徴量を作成する。こうした人工特徴量により、異常検知モデルは現在のセンサー値に反応するだけでなく、設備故障を数日前に予測できる。
信用リスク評価：金融機関は特徴量エンジニアリングを用いて融資適格性を評価する。単純な「収入」数値を見る代わりに、「債務収入比率」や「クレジット利用率」といった派生特徴量を構築する。これらの派生特徴量は借り手の財務健全性をより詳細に把握でき、より正確なリスク分類を可能にする。

コード例：カスタム機能拡張

コンピュータビジョンでは、画像を拡張して様々な環境条件をシミュレートすることで特徴を「設計」できる。これにより、例えば YOLO26 より良く一般化する。以下の例は、単純なグレースケール変換を適用する方法を示す。 ultralytics ツールは、モデルが色のみに依存するのではなく構造的特徴を学習することを強制する。

import cv2
from ultralytics.data.augment import Albumentations

# Load an example image using OpenCV
img = cv2.imread("path/to/image.jpg")

# Define a transformation pipeline to engineer new visual features
# Here, we convert images to grayscale with a 50% probability
transform = Albumentations(p=1.0)
transform.transform = A.Compose([A.ToGray(p=0.5)])

# Apply the transformation to create a new input variation
augmented_img = transform(img)

# This process helps models focus on edges and shapes, improving robustness

特徴量エンジニアリング

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

AIにおける特徴量エンジニアリングの役割

一般的な技術と応用

実世界の例

コード例：カスタム機能拡張

関連用語との区別

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

特徴量エンジニアリング

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

AIにおける特徴量エンジニアリングの役割

一般的な技術と応用

実世界の例

コード例：カスタム機能拡張

関連用語との区別

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？ 概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

単眼深度推定とは何か？概要