現在の動的ネットワークと動的プルーニング方法は、理論的な計算の複雑さを軽減する上で有望な機能を示しています。ただし、畳み込みフィルターの動的スパースパターンは、インデックス作成、重みコピー、またはゼロマスキングの余分な負担のため、実際の実装では実際の加速を達成できません。ここでは、Dynamic Slimmable Network(DS-Net)という名前の動的ネットワークスリミング体制について説明します。これは、フィルターを静的に保存し、余分な負担を防ぐためにハードウェアで連続して。当社のDS-Netは、アテンションヘッドとスリミングヘッドで構成される提案された双頭ダイナミックゲートによる動的推論の機能を備えており、ごくわずかな追加計算コストでネットワーク幅を予測的に調整します。各候補アーキテクチャの一般性とゲートの公平性を確保するために、ワンショットNASに触発された解きほぐされた2段階のトレーニングスキームを提案します。最初の段階では、スーパーネットのトレーニング効率を向上させるために、インプレースアンサンブルブートストラップという名前の重み共有ネットワークの新しいトレーニング手法が提案されます。第2段階では、サンドイッチゲートスパーシフィケーションが提案され、オンラインで簡単なサンプルと難しいサンプルを特定することでゲートトレーニングを支援します。広範な実験により、DS-Netは、静的な対応物や最先端の静的および動的モデル圧縮方法を大幅に上回っています(最大5.9%)。通常、DS-Netは、ImageNetでの精度の低下を最小限に抑えながら、ResNet-50およびMobileNetに比べて2〜4倍の計算削減と1.62倍の実際の加速を実現します。コードリリース:https://github.com/changlin31/DS-Net。
Current dynamic networks and dynamic pruning methods have shown their promising capability in reducing theoretical computation complexity. However, dynamic sparse patterns on convolutional filters fail to achieve actual acceleration in real-world implementation, due to the extra burden of indexing, weight-copying, or zero-masking. Here, we explore a dynamic network slimming regime, named Dynamic Slimmable Network (DS-Net), which aims to achieve good hardware-efficiency via dynamically adjusting filter numbers of networks at test time with respect to different inputs, while keeping filters stored statically and contiguously in hardware to prevent the extra burden. Our DS-Net is empowered with the ability of dynamic inference by the proposed double-headed dynamic gate that comprises an attention head and a slimming head to predictively adjust network width with negligible extra computation cost. To ensure generality of each candidate architecture and the fairness of gate, we propose a disentangled two-stage training scheme inspired by one-shot NAS. In the first stage, a novel training technique for weight-sharing networks named In-place Ensemble Bootstrapping is proposed to improve the supernet training efficacy. In the second stage, Sandwich Gate Sparsification is proposed to assist the gate training by identifying easy and hard samples in an online way. Extensive experiments demonstrate our DS-Net consistently outperforms its static counterparts as well as state-of-the-art static and dynamic model compression methods by a large margin (up to 5.9%). Typically, DS-Net achieves 2-4x computation reduction and 1.62x real-world acceleration over ResNet-50 and MobileNet with minimal accuracy drops on ImageNet. Code release: https://github.com/changlin31/DS-Net .