CapsNetsと呼ばれるカプセルネットワークは、従来の畳み込みニューラルネットワーク(CNN)のいくつかの限界に対処するために設計された新しいタイプのニューラルネットワークアーキテクチャであり、特に画像内の空間階層と特徴間の関係を扱うことができる。プーリング演算によるスカラー出力を使用するCNNとは異なり、CapsNetsは特徴を表現するためにベクトルを使用するため、物体の向きや相対的な空間位置に関するより詳細な情報を捉えることができる。この能力により、CapsNetsは画像認識のような、物体の姿勢や空間的関係を理解することが重要なタスクにおいて特に効果的となる。
CapsNetsは「カプセル」という概念を導入している。カプセルとは、活動ベクトル が物体や物体の一部など、特定のタイプの実体のさまざまな特性を表すニューロン のグループである。アクティビティ・ベクトルの長さは、エンティティが存在する確率を表し、その方向は、インスタンス化のパラメータ(例えば、位置、サイズ、方向)をエンコードする。あるレベルのアクティブなカプセルは、変換行列を介して、上位レベルのカプセルのインス タンス化パラメータの予測を行う。複数の予測が一致すると、上位レベルのカプセルがアクティブになる。このプロセスは "routing-by-agreement "として知られている。
CapsNetsと畳み込みニューラルネットワーク(CNN)はどちらもコンピュータビジョン(CV)タスクで使用されるが、空間情報を処理するアプローチにおいて大きく異なる:
CapsNetsは従来のCNNに比べていくつかの利点がある:
カプセル・ネットワークは様々なアプリケーションで有望視されており、ディープラーニング(DL)分野を発展させる可能性を示している:
CapsNetsはその長所にもかかわらず、CNNに比べて計算複雑度が高く、アーキテクチャや学習手順を最適化するためのさらなる研究が必要であるなどの課題も抱えている。現在進行中の研究は、動的ルーティングの効率改善、新しいカプセルタイプの探求、画像認識以外の幅広いタスクへのCapsNetsの適用に重点を置いている。
人工知能(AI)の分野が進化を続ける中、カプセル・ネットワークは、よりロバストで汎用性の高いニューラルネットワーク・モデルを作成するための新たな可能性を提供する、エキサイティングな開発分野である。詳細な空間情報をキャプチャし、変換を処理する能力により、コンピュータ・ビジョンやその他のAIアプリケーションを進化させる貴重なツールとなっている。最先端のAIモデルを探求することに興味がある人のために、Ultralytics YOLO モデルは、この分野の最新の進歩のいくつかを組み込んだ最先端の物体検出アーキテクチャを提供します。さらに、Ultralytics HUBは、これらのモデルをトレーニングおよびデプロイするためのプラットフォームを提供し、高度なAIソリューションの開発と応用をさらに促進します。