転移学習は機械学習における強力な手法であり、ある問題を解決することで得た知識を、関連する別の問題に適用することを可能にする。毎回ゼロからモデルを訓練する代わりに、転移学習は事前に訓練されたモデルを活用するため、時間とリソースを節約でき、特に新しいタスクのデータが限られている場合には、しばしば性能が向上する。このアプローチは、より効果的で効率的なAIシステムを構築するために、様々な分野、特にコンピュータ・ビジョンや自然言語処理で広く利用されている。
転移学習の中核となる考え方は、大規模なデータセットでモデルが学習した特徴を、新しい、多くの場合より小規模なデータセットに利用することである。通常、モデルはまず、画像分類などの一般的なタスクのために、ImageNetのような巨大なデータセットで学習される。この事前学習段階によって、モデルはデータから基本的な特徴やパターンを学習することができる。次に、関連する新しいタスクに対して、事前学習されたモデルの重みが出発点として使用される。この第2段階は、しばしば微調整と呼ばれ、新しいタスク固有のデータセットでモデルをさらに訓練する。多くの場合、モデルの最終層のみが再トレーニングされ、一般的な特徴を学習した以前の層は凍結されたままか、より低い学習率でトレーニングされる。
ディープ・ニューラル・ネットワークの初期層は一般的な特徴(例えば、画像のエッジやテクスチャー)を学習する傾向があり、それらは異なるが関連するタスク間で移行可能であることが多いため、この方法は特に効果的である。これらの学習された特徴を再利用することで、転移学習は新しい問題ごとに膨大なデータと計算リソースの必要性を減らす。
トランスファー学習は多くの領域で応用されている。具体的な例をいくつか挙げてみよう:
医用画像解析:医療画像解析では、特定の疾患に関するデータセットが小さく、取得が困難な場合がある。転移学習は、一般的な画像データセットで事前に訓練されたモデルを、X線写真の腫瘍検出やMRIスキャンの臓器分割のようなタスクのために効果的に微調整することを可能にする。これは、ヘルスケアにおけるAIの応用で強調されているように、診断精度と効率を向上させるために非常に重要である。
特定領域における物体検出:一般的な物体検出のための大規模なデータセットが存在する一方で、特殊なアプリケーションでは、固有のコンテキストで特定の物体を検出するモデルが必要とされることが多い。例えば、農業分野のコンピュータビジョンでは、広範な物体検出データセットで事前に訓練されたモデルを、農業画像内の特定の種類の作物や害虫を検出するために微調整することができます。このアプローチは、データ収集が困難で領域固有の専門知識が重要な、精密農業のようなアプリケーションに特に関連する。Ultralytics YOLO モデル、たとえば YOLOv8やYOLOv11のようなモデルは、事前に訓練された重みと微調整機能を活用し、様々な物体検出タスクに伝達学習と共に頻繁に使用される。
Ultralytics YOLOモデルは転移学習によって容易に適応できるように設計されている。YOLOv5 、YOLOv8 、 YOLOv11 のようなモデルに対して、Ultralytics HUB で利用可能な事前学習済みの重みを容易に活用することができます。カスタムデータセット上でこれらの事前学習済みモデルを微調整することで、ユーザーは特定の物体検出、セグメンテーション、または分類タスクで高いパフォーマンスを迅速に達成することができます。Ultralytics HUBのクラウド・トレーニング機能は、このプロセスをさらに簡素化し、ユーザーは大規模なセットアップを行うことなく、クラウド環境でモデルをトレーニングし、微調整することができます。また、ハイパーパラメータチューニングのようなテクニックを微調整中に適用することで、特定のタスクに対するモデルのパフォーマンスをさらに最適化することができます。
転移学習は現代の機械学習の基礎であり、AIモデル開発の効率と効果に大きな影響を与える。事前に訓練されたモデルの知識を再利用することで、AIを民主化し、特にデータや計算リソースが限られたシナリオにおいて、より幅広い用途でよりアクセスしやすく実用的なものにする。開発を加速し、モデルのパフォーマンスを向上させる能力により、AI業界において不可欠なツールとなっています。