arXiv reaDer
RMNet:ネットワークから残りの接続を同等に削除する
RMNet: Equivalently Removing Residual Connection from Networks
残余接続は非常に深いニューラルネットワークのトレーニングを可能にしますが、マルチブランチトポロジのため、オンライン推論には適していません。これにより、多くの研究者は、推論時に接続が残っていないDNNの設計に取り組むようになります。たとえば、RepVGGは、展開時にマルチブランチトポロジをVGGのような(シングルブランチ)モデルに再パラメータ化し、ネットワークが比較的浅い場合に優れたパフォーマンスを示します。ただし、RepVGGはResNetをVGGに同等に変換できません。これは、再パラメーター化方法は線形ブロックにのみ適用でき、非線形レイヤー(ReLU)は残差接続の外側に配置する必要があるため、特に深い場合は表現能力が制限されます。ネットワーク。このホワイトペーパーでは、この問題を解決し、ResBlockでの予約とマージ(RM)操作によって、バニラResNetの残りの接続を同等に削除することを提案します。具体的には、RM操作により、入力特徴マップが情報を予約しながらブロックを通過し、各ブロックの最後ですべての情報をマージできるため、元の出力を変更せずに残りの接続を削除できます。プラグイン方式として、RM操作には基本的に3つの利点があります。1)その実装により、高比率のネットワークプルーニングに自然に適しています。 2)RepVGGの深さ制限を打破するのに役立ちます。 3)ResNetやRepVGGと比較して、精度と速度のトレードオフネットワーク(RMNet)が向上します。 RMオペレーションのイデオロギーは、将来のコミュニティのモデル設計に関する多くの洞察を刺激することができると信じています。コードはhttps://github.com/fxmeng/RMNetで入手できます。
Although residual connection enables training very deep neural networks, it is not friendly for online inference due to its multi-branch topology. This encourages many researchers to work on designing DNNs without residual connections at inference. For example, RepVGG re-parameterizes multi-branch topology to a VGG-like (single-branch) model when deploying, showing great performance when the network is relatively shallow. However, RepVGG can not transform ResNet to VGG equivalently because re-parameterizing methods can only be applied to linear blocks and the non-linear layers (ReLU) have to be put outside of the residual connection which results in limited representation ability, especially for deeper networks. In this paper, we aim to remedy this problem and propose to remove the residual connection in a vanilla ResNet equivalently by a reserving and merging (RM) operation on ResBlock. Specifically, the RM operation allows input feature maps to pass through the block while reserving their information and merges all the information at the end of each block, which can remove residual connections without changing the original output. As a plug-in method, RM Operation basically has three advantages: 1) its implementation makes it naturally friendly for high ratio network pruning. 2) it helps break the depth limitation of RepVGG. 3) it leads to better accuracy-speed trade-off network (RMNet) compared to ResNet and RepVGG. We believe the ideology of RM Operation can inspire many insights on model design for the community in the future. Code is available at: https://github.com/fxmeng/RMNet.
updated: Mon Nov 01 2021 04:07:45 GMT+0000 (UTC)
published: Mon Nov 01 2021 04:07:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト