用語集

イメージネット

1,400万枚以上の画像から構成され、AI研究、モデル、アプリケーションの発展に貢献する画期的なデータセット、ImageNetをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ImageNetは、画像認識の研究を促進するために設計された、コンピュータ・ビジョンの分野における基礎的なデータセットである。WordNetの階層構造に従って構成されており、English 、名詞、動詞、形容詞、副詞を中心とした意味のある各概念を「シンセット(synset)」と呼ぶ。ImageNetはWordNetの全シンセットをマッピングすることを目的としており、現在、20,000以上のシンセットに対して約1,400万枚の画像を提供している。この膨大なコレクションは、特に画像分類や物体検出のようなタスクにおいて、機械学習モデルの訓練や評価に貴重なリソースとなっている。

意義と妥当性

ImageNetの誕生は、ディープラーニング革命、特にコンピュータビジョンタスクにとって極めて重要な出来事であった。ImageNetが誕生する以前は、ラベル付き画像データの規模と多様性が、ロバストなモデルを学習する上での大きな制約となっていた。ImageNetは、大規模で綿密に注釈が付けられたデータセットを提供することで、この問題に対処し、研究者は畳み込みニューラルネットワーク(CNN)など、より深く複雑なモデルの学習を可能にした。2010年から2017年まで毎年開催されたImageNet Large Scale Visual Recognition Challenge(ILSVRC)は、物体検出と 画像分類アルゴリズムを評価するベンチマークとなった。ImageNetでの入賞モデルは、しばしば最先端の結果を打ち立て、現代のコンピュータビジョンアーキテクチャの開発に大きな影響を与えた。

イメージネットの応用

ImageNetの影響力は、人工知能と機械学習における数多くのアプリケーションに及んでいる:

  • 事前学習の重み:ImageNetで事前に訓練されたモデルは、様々なコンピュータビジョンタスクにおける転移学習の優れた出発点となる。例えば Ultralytics YOLOモデルは、カスタムデータセットやタスクでのパフォーマンスを向上させるために、ImageNetで事前にトレーニングされたバックボーンを利用することがよくあります。このアプローチは、特に限られたデータを扱う場合に、トレーニング時間を大幅に短縮し、モデルの精度を向上させます。
  • ベンチマークImageNetは、新しい画像認識モデルやアーキテクチャの性能を評価するための重要なベンチマークであり続けている。研究者は、ImageNet検証セットにおけるモデルの精度を頻繁に報告し、進歩の実証や既存の手法との比較を行っています。
  • データセットの作成方法ImageNetプロジェクトは、新しいデータセットの作成方法やアノテーション方法にも影響を与えている。その厳格なアノテーション・プロセスと大規模なアプローチは、コンピュータ・ビジョンのコミュニティにおけるデータ品質とデータ量の基準を設定しました。
  • 研究開発 ディープラーニングニューラルアーキテクチャの探索ハイパーパラメータのチューニングにおける新しいテクニックを探求するために、学術的および産業的な研究において幅広く使用され続けている。

実例

  1. 医用画像解析における画像分類 医用画像解析では、最初にImageNetで学習させたモデルを、X線やCTスキャンなどの医用画像を病気検出用に分類するために微調整することができる。この転移学習アプローチにより、ラベル付けされた医療データが限られていても、診断ツールの効率的な開発が可能になる。
  2. 自律走行車における物体検出:自動運転車は環境を認識するために物体検出アーキテクチャに大きく依存している。ImageNetで事前に訓練されたモデルは、歩行者、車両、交通標識のような道路オブジェクトを検出し分類するために適応することができ、より安全で信頼性の高い自律走行車に貢献する。

ImageNetはこの分野の発展に貢献してきましたが、その限界を認識し、バイアスに対処してAIにおける視覚理解の範囲を広げる、より包括的でバランスの取れたデータセットに向かって進化し続けていることを認識することが重要です。Ultralytics HUBのようなリソースは、事前に訓練されたモデルやカスタムデータセットの使用を容易にし、ImageNetのようなデータセットによって築かれた基礎の上に、実世界のコンピュータビジョンの課題に取り組むことができます。

すべて読む