用語集

イメージネット

1,400万枚以上の画像から構成され、AI研究、モデル、アプリケーションの発展に貢献する画期的なデータセット、ImageNetをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ImageNetは、コンピュータビジョン(CV)の研究開発で広く使われている、非常に大規模で基礎的なデータセットである。ImageNetは1,400万枚以上の画像から構成され、どのような物体が写っているかを示すために手作業で注釈が付けられ、WordNetの階層構造に従って整理されている。20,000以上のカテゴリ(シセット)を持つImageNetは、特に画像分類や 画像認識のようなタスクにおいて、機械学習(ML)モデルの訓練と評価に豊富で多様なリソースを提供する。その膨大なスケールと詳細なアノテーションは、この分野の進歩に不可欠なものです。このデータセットをUltralytics モデルで使用する方法については、ImageNet Dataset documentation pageをご覧ください。

意義と妥当性

ImageNetの登場は、ディープラーニング(DL)、特にコンピュータビジョンにとって極めて重要な出来事だった。ImageNetが登場する以前は、大規模かつ多様で、ラベル付けされたデータセットの欠如が大きなボトルネックとなっていた。ImageNetは、畳み込みニューラルネットワーク(CNN)など、より深く複雑なモデルの学習を可能にし、大きなブレークスルーをもたらした。2010年から2017年まで毎年開催されたImageNet Large Scale Visual Recognition Challenge(ILSVRC)は、ImageNetのサブセットを使用し、画像分類と物体検出アルゴリズムを評価するための標準ベンチマークとなった。ImageNetで最先端の結果を達成したAlexNetや ResNetのようなモデルは、現代のCVアーキテクチャに大きな影響を与えた。

イメージネットの応用

ImageNetの主な用途は、新しいコンピュータビジョンモデルやアルゴリズムを評価するための標準的なベンチマークとして機能することである。ベンチマーク以外にも、モデルの事前学習に広く使用されています。

  • 転移学習のための事前学習:ImageNetでトレーニングされたモデルは、他の様々な視覚タスクに役立つ一般的な視覚特徴を学習します。転移学習として知られるこの手法により、開発者は、(Ultralytics HUBで利用可能なような)事前に訓練されたモデルを、はるかに小規模なカスタムデータセットを使用して特定のアプリケーションに適応させることができ、訓練時間とデータ要件を大幅に削減することができます。多くの Ultralytics YOLOモデルは、大規模なデータセットで事前に訓練された重みを活用しています。
  • 研究の推進ImageNetは、表現学習、ドメイン適応、ディープニューラルネットワークの内部構造の理解といった分野の研究を促進し続けている。

実例

  1. 医用画像解析:ImageNetには医用画像は含まれていませんが、ImageNetで事前にトレーニングされたモデルは、医用画像解析のタスクの出発点として頻繁に使用されています。 YOLO 学習した一般的な特徴抽出機能は、X線、CTスキャン、MRIなどの小規模なデータセットで微調整することができ、腫瘍や骨折などの異常の検出に役立ちます。
  2. 自律走行車:物体認識モデルは自律走行車の基本である。歩行者、自動車、信号機、道路標識の識別に使用される基礎モデルの多くは、最初にImageNetを使用して開発され、ベンチマークされました。

ImageNetと他のデータセットとの比較

ImageNetは膨大で分類タスクに優れているが、他のデータセットは異なる目的を果たす。例えば、COCOデータセット(Common Objects in Context)は、オブジェクトの検出、セグメンテーション、キャプション付けに広く使用されており、ImageNetに比べて少ないオブジェクトカテゴリに対して、インスタンスマスクやバウンディングボックスのような、より詳細なアノテーションを提供している。同様に、Open Images V7は、多数のオブジェクトクラスのバウンディングボックスを提供する。データセットの選択は、多くの場合、分類、検出、セグメンテーションなどの特定のコンピュータビジョンタスクに依存します。様々なコンピュータビジョンデータセットを調べることは、プロジェクトに最も適したものを選択するのに役立ちます。

すべて読む