用語集

残留ネットワーク(ResNet)

ResNetsが消失勾配を解決することでディープラーニングにどのような革命をもたらし、画像解析やNLPなどのための超ディープネットワークを可能にしているかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

ResNetとして一般的に知られているResidual Networksは、主にコンピュータビジョン(CV)で使用される極めて重要なディープラーニング(DL)アーキテクチャである。Kaiming Heらの論文「Deep Residual Learning for Image Recognition」で紹介されたResNetは、非常に深いニューラルネットワークを学習するという課題に取り組んでいる。ResNet以前は、従来の畳み込みニューラルネットワーク(CNN)で単純にレイヤーを重ねるだけで、オーバーフィッティングが原因ではなく、より深いモデルを最適化するのが難しくなるため、精度が飽和してすぐに低下するという、劣化と呼ばれる問題がしばしば生じていた。ResNetの革新的な技術により、数百層、数千層もの深いネットワークの学習が可能になりました。

ResNetの仕組み残留コネクション

ResNetの核となる考え方は、「ショートカット接続」または「スキップ接続」の導入である。これらの接続は1つ以上のレイヤーを迂回し、前のレイヤーからの出力を前のレイヤーに追加するIDマッピングを行う。この構造は、バックプロパゲーションによる学習中にディープネットワークをしばしば悩ませる、勾配の消失問題に取り組むのに役立つ。ResNetでは、各レイヤーに最適なマッピングを直接学習させる代わりに、スキップ接続によって提供される同一性関数に対する残差マッピングを学習させる。これにより、ネットワークは必要に応じてアイデンティティ・マッピングを学習しやすくなり(つまり、有益でないブロックは効果的にスキップできる)、非常に深いアーキテクチャの最適化プロセスが簡素化され、通常のディープ・ネットワークで見られる劣化問題が緩和される。

ResNetのアプリケーション

ResNetsはコンピュータ・ビジョンの基礎となるアーキテクチャであり、多くのアプリケーションで広く使用されている:

  • 画像分類:ResNetsは、ImageNetのような画像分類ベンチマークで最先端の結果を達成しました。非常に深いネットワークから効果的に学習する能力により、物体やシーンを識別する精度が大幅に向上しました。多くの最新のアーキテクチャは、特徴抽出のための強力なバックボーンとしてResNetまたはその変種を使用しています。
  • オブジェクトの検出とセグメンテーション:次のようなアーキテクチャ Ultralytics YOLOのようなアーキテクチャは、豊富な特徴を抽出するためのバックボーンとしてResNetの変種を利用することがよくあります。物体検出では、ResNetは物体の正確な位置特定と分類に役立ちます。これは、小売店の棚のレイアウト分析や、交通監視システムにおける車両の識別などのアプリケーションにとって極めて重要です。例えばセグメンテーションでは、ピクセルレベルの正確なオブジェクトの輪郭抽出に貢献します。ResNetの比較については、様々なオブジェクト検出アーキテクチャをご覧ください。
  • 医用画像解析:ResNetは腫瘍の検出、スキャン画像からの病気の分類、臓器のセグメンテーションなどのタスクに使用されます。例えば、CTスキャンを解析する場合、ResNetベースのモデルは放射線治療計画のために腫瘍の境界を明確にするのに役立ちます。深さと表現力は微妙なパターンを捉えるために不可欠であり、ヘルスケアソリューションのAIにおける診断を向上させます。
  • 顔認識:ResNetsは顔画像からのロバストな特徴抽出に使用され、セキュリティやアクセス制御システムにおいて正確な識別と検証を可能にします。

ResNetの利点

ResNetの主な利点は、劣化や消失勾配の問題を克服し、非常に深いネットワークを効果的に学習できることである。この深さにより、ResNetはより複雑なパターンや階層的な特徴をトレーニングデータから学習することができ、様々なCVタスクにおけるパフォーマンスの向上につながります。また、ResNetのアーキテクチャは比較的単純であり、多くの最新の深層学習モデルにおいて標準的なコンポーネントとして機能しています。その強力な性能と適応性により、ResNetはAIの研究と応用における基礎となっています。ユーザーは、Ultralytics HUBのようなプラットフォームを使って、事前訓練されたResNetモデルを移行学習に活用したり、カスタムデータセット上で微調整を行ったりすることで、開発を加速させることができます。

すべて読む