用語集

データ拡張

データ拡張がモデルの頑健性を向上させ、過学習を低減する仕組みを探求します。Ultralytics 向上させる主要な手法を学びます。

データ拡張は、機械学習およびコンピュータビジョンにおいて重要な技術であり、既存データの修正版を作成することで、訓練データセットの規模と多様性を人工的に増加させるために用いられる。時間と費用がかかる新規データの収集・ラベリングに代わって、拡張では元のサンプルに様々な変換を適用します。こうした変更により機械学習モデルはパターンをより頑健に認識できるようになり、実環境での変動に遭遇しても良好な性能を発揮します。トレーニング中にモデルをより幅広いシナリオに晒すことで、開発者は過学習を効果的に低減し汎化性能を向上させられます。

現代のAIにおける関連性

コンピュータビジョン分野では、モデルは訓練データとわずかに異なる画像に直面するとしばしば苦戦する。照明、向き、背景の雑多さといった変化は、十分な多様性を学習していないモデルを混乱させることがあります。データ拡張は、これらの変化をプログラム的にシミュレートすることでこの問題を解決します。例えば、猫の画像を回転させたり反転させたり、わずかにぼかしたりすることで、こうした変化があっても対象が「猫」であることに変わりないことをモデルに教えます。

このプロセスは、Ultralytics 現代的なアーキテクチャの成功に不可欠です。このモデルは、物体検出や画像セグメンテーションといったタスクで高い精度を達成するために、豊富で多様なデータセットに依存しています。新しい訓練例を合成することで、データ拡張はモデルが不変特徴を学習することを可能にします。不変特徴とは、入力が変化しても変わらない特性です。

一般的な技術と手法

データ拡張は、単純な幾何学的調整から複雑な生成手法に至るまで、多様な変換技術を含む：

幾何学的変換：これには、画像の回転、拡大縮小、反転、トリミング、平行移動（シフト）などの操作が含まれます。これらはカメラの視点や物体の位置の変化を表します。
カラースペース調整：明るさ、コントラスト、彩度、色相を変更することで、モデルが異なる照明条件やカメラセンサーに対応できるようになります。
ノイズ注入：ランダムノイズ（ガウスノイズなど）を追加することで、モデルは粒状感や低品質な入力データに対する耐性を高めることができます。
画像の混合： MixUp モザイク（YOLO 人気）のような手法は、複数の画像を単一のトレーニングサンプルに統合し、モデルが文脈と物体間の関係をより効果的に学習することを強制する。
生成アプローチ：高度な手法では生成AIまたは拡散モデルを用いて、元のデータセットの特性を模倣した全く新しい合成トレーニングサンプルを生成します。

実際のアプリケーション

データ拡張の実用的な影響は、データの不足や変動性の高さが課題となる数多くの産業に及んでいる。

自動運転

自動運転車の開発において、あらゆる気象条件や照明シナリオのデータを収集することはほぼ不可能です。エンジニアはデータ拡張技術を用いて、晴天時の画像に雨、霧、雪、またはグレアをシミュレートします。これにより、知覚システムが環境要因に関係なくdetect 、交通標識、その他の車両detect 確実にdetect になり、安全性と信頼性が向上します。

医療画像

医療画像解析では、プライバシー上の懸念や特定の疾患の希少性により、データセットが限られることが多々ある。拡張技術を用いることで、研究者はX線やMRIスキャンといった小規模なデータセットを、弾性変形、回転、輝度シフトを適用することで拡大できる。これにより、患者の体位やスキャン品質が異なる場合でも、腫瘍や骨折を高感度で識別可能な堅牢な診断モデルを訓練することが可能となる。

Ultralyticsによる拡張機能の実装

現代のフレームワークは拡張処理をトレーニングパイプラインに直接統合している。以下の例は、YOLO26モデルのトレーニング中に反転やスケーリングといった拡張処理を適用する方法を示す。 ultralytics パッケージで提供される。

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

これらのハイパーパラメータを調整することで、開発者はデータセットとアプリケーションの特定のニーズに合わせて拡張戦略を調整でき、Ultralytics 柔軟性を活用して効率的なモデル開発を実現します。

データ拡張

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

現代のAIにおける関連性

一般的な技術と手法

実際のアプリケーション

自動運転

医療画像

関連概念の区別

Ultralyticsによる拡張機能の実装

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

データ拡張

Ultralytics YOLO モデルをトレーニングし、業種を問わずワークフローを効率化する

お客様のイノベーションを強化する柔軟なエンタープライズライセンスソリューション

Ultralytics YOLOAIモデルを数秒でトレーニング

現代のAIにおける関連性

一般的な技術と手法

実際のアプリケーション

自動運転

医療画像

関連概念の区別

Ultralyticsによる拡張機能の実装

このカテゴリの関連記事

コンピュータービジョンを活用した12の航空写真活用事例

単眼深度推定とは何か？ 概要

Ultralytics YOLO を用いたAI脅威検知の活用事例

Ultralytics コミュニティに参加する

単眼深度推定とは何か？概要