arXiv reaDer
Efficient-CapsNet:セルフアテンションルーティングを備えたカプセルネットワーク
Efficient-CapsNet: Capsule Network with Self-Attention Routing
アーキテクチャ設計戦略の支援を受けた深い畳み込みニューラルネットワークは、データ拡張技術と多数の特徴マップを備えたレイヤーを広範囲に使用して、オブジェクト変換を埋め込みます。これは非常に非効率的であり、大規模なデータセットの場合、機能検出器の大規模な冗長性を意味します。カプセルネットワークはまだ揺籃期にありますが、現在の畳み込みネットワークを拡張し、すべての特徴アフィン変換をより効率的にエンコードするプロセスを人工視覚に与えるための有望なソリューションを構成します。実際、適切に機能するカプセルネットワークは、新しい視点に一般化する固有の機能により、理論的にはかなり少ない数のパラメーターカウントでより高い結果を達成するはずです。それにもかかわらず、この関連する側面にはほとんど注意が払われていません。このホワイトペーパーでは、カプセルネットワークの効率を調査し、パラメータがわずか160Kの極端なアーキテクチャで容量を限界まで押し上げ、提案されたアーキテクチャが3つの異なるアーキテクチャで最先端の結果を達成できることを証明します。元のCapsNetパラメーターの2%のみを含むデータセット。さらに、動的ルーティングを、カプセルの数の減少に簡単に対処できる、新しい非反復的で高度に並列化可能なルーティングアルゴリズムに置き換えます。他のカプセル実装を使用した広範な実験により、私たちの方法論の有効性と、一般化されやすい視覚的表現を効率的に埋め込むカプセルネットワークの機能が証明されました。
Deep convolutional neural networks, assisted by architectural design strategies, make extensive use of data augmentation techniques and layers with a high number of feature maps to embed object transformations. That is highly inefficient and for large datasets implies a massive redundancy of features detectors. Even though capsules networks are still in their infancy, they constitute a promising solution to extend current convolutional networks and endow artificial visual perception with a process to encode more efficiently all feature affine transformations. Indeed, a properly working capsule network should theoretically achieve higher results with a considerably lower number of parameters count due to intrinsic capability to generalize to novel viewpoints. Nevertheless, little attention has been given to this relevant aspect. In this paper, we investigate the efficiency of capsule networks and, pushing their capacity to the limits with an extreme architecture with barely 160K parameters, we prove that the proposed architecture is still able to achieve state-of-the-art results on three different datasets with only 2% of the original CapsNet parameters. Moreover, we replace dynamic routing with a novel non-iterative, highly parallelizable routing algorithm that can easily cope with a reduced number of capsules. Extensive experimentation with other capsule implementations has proved the effectiveness of our methodology and the capability of capsule networks to efficiently embed visual representations more prone to generalization.
updated: Fri Jan 29 2021 09:56:44 GMT+0000 (UTC)
published: Fri Jan 29 2021 09:56:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト