用語集

残留ネットワーク(ResNet)

ResNetsが消失勾配を解決することでディープラーニングにどのような革命をもたらし、画像解析やNLPなどのための超ディープネットワークを可能にしているかをご覧ください。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

一般的にResNetsとして知られるResidual Networksは、ディープラーニングの分野、特に深い畳み込みニューラルネットワークの設計において重要な進歩である。ResNetsは、非常に深いネットワークを学習する際の重要な課題である「勾配の消失問題」に対処するために導入された。ネットワークが深くなると、多くの場合、学習が難しくなり、性能が低下する。ResNetsは、これまでにない深さのネットワークのトレーニングを可能にすることで、ネットワークアーキテクチャに革命をもたらし、様々なコンピュータビジョンタスクの大幅な改善につながりました。

キーコンセプト

ResNetアーキテクチャの核心は、"スキップ接続 "とも呼ばれる "残余接続 "の概念である。従来のディープネットワークは、入力から出力への直接的なマッピングを学習する。対照的に、ResNetは残差マッピングを学習するように設計されている。残差ブロックは、複雑な関数を直接学習しようとする代わりに、「残差」、つまり入力と希望する出力の差を学習する。これは、ブロックの元の入力をその出力に追加することによって達成され、効果的にショートカットまたはスキップ接続を作成します。

この一見単純に見える修正には深い意味がある。スキップ接続により、勾配がネットワーク内をより容易に流れるようになり、勾配の消失問題が緩和される。有益な場合、ネットワークに同一性マッピング(出力が入力と同じ)を学習させることで、ResNetは性能に寄与しないレイヤーを効果的にバイパスすることができます。この技術革新により、ResNet-50、ResNet-101、さらにはResNet-152のような、それぞれ50層、101層、152層を持つ非常に深いネットワークの学習が可能になり、以前の浅いアーキテクチャを大幅に凌駕しています。

ResNetのアプリケーション

ResNetsはコンピュータ・ビジョンの基礎となるアーキテクチャであり、多くのアプリケーションで広く使用されている:

  • 画像の分類ResNetsはImageNetのような画像分類ベンチマークで最先端の結果を達成しています。非常に深いネットワークから効果的に学習する能力により、画像内のオブジェクト、シーン、カテゴリの識別などのタスクの精度が大幅に向上しました。例えば Ultralytics YOLOモデルでは、ResNetのようなバックボーンを統合することで、物体検出や画像分類タスクの特徴抽出を強化することができます。

  • オブジェクトの検出とセグメンテーション:以下のようなアーキテクチャがあります。 Ultralytics YOLOv8SAM (Segment Anything Model)のようなアーキテクチャは、特徴抽出のバックボーンとしてResNetを利用することが多い。物体検出では、ResNetsはロバストで深い特徴表現を提供することで、画像内の物体の正確な位置特定と分類に役立ちます。例えばセグメンテーションでは、ResNetsは正確なピクセルレベルのオブジェクトの輪郭抽出と認識に貢献し、自律走行や医療画像解析のようなアプリケーションに極めて重要です。

  • 医療画像解析 医療画像解析では、ResNetsは腫瘍の検出、病気の分類、臓器のセグメンテーションなどのタスクに使用される。ResNetsの深さと表現力は、複雑な医療画像の微妙なパターンを捉え、診断精度と治療計画を向上させるために不可欠です。

  • 顔認識:ResNetsは、顔画像からの特徴抽出のための顔認識システムに採用されています。その深いアーキテクチャは、複雑な顔の特徴を学習することを可能にし、セキュリティ、監視、パーソナライズされたアプリケーションにおいて、非常に正確な識別と検証につながります。

  • 自然言語処理(NLP)とその後:残差結合の概念は、主にコンピュータビジョンで使用されているが、自然言語処理(NLP)を含む他の領域にも影響を与えている。ResNetsの成功は、NLPや機械学習の他の分野でも同様のアーキテクチャを触発し、このアーキテクチャの革新が広範な影響力を持つことを示している。

ResNetの利点

ResNetの主な利点は、非常に深いネットワークを効率的に学習できることで、従来のディープネットワークで発生していた劣化の問題を克服している。この深さにより、ResNetはより複雑で階層的な特徴を学習することができ、様々なタスクにおける性能向上につながります。さらに、ResNetアーキテクチャは実装が比較的簡単で、多くの最新のディープラーニングモデルの標準的な構成要素となっています。その強固な性能と使いやすさにより、ResNetはディープラーニングと人工知能の進歩における礎石として確固たる地位を築いています。ビジョンAIモデルの実装と最適化を目指すユーザーにとって、ResNetアーキテクチャを理解することは非常に重要であり、Ultralytics HUBのようなプラットフォームは、様々なアプリケーションのためのResNetベースのモデルのトレーニングと展開を容易にすることができます。

すべて読む