ニューラル画像の圧縮は、従来の方法(JPEG、BPG、WebPなど)に到達するか、それを上回りました。ただし、カスケード畳み込み層を備えた高度なネットワーク構造は、実際の展開に大きな計算負荷をもたらします。この論文では、特別なハードウェア設計やアルゴリズムなしでリアルタイムの加速を得るために、神経画像圧縮ネットワークの構造的スパース性を調査します。各畳み込みチャネルの重要性を判断し、トレーニング中にスパース性を導入するために、単純なプラグイン適応バイナリチャネルマスキング(ABCM)を提案します。推論中、重要でないチャネルは、よりスリムなネットワークとより少ない計算を得るために剪定されます。エントロピーモデルが異なる3つのニューラル画像圧縮ネットワークにこの方法を実装して、その有効性と一般化を検証します。実験結果は、パフォーマンスの低下を無視して、最大7倍の計算削減と3倍の加速を実現できることを示しています。
Neural image compression have reached or out-performed traditional methods (such as JPEG, BPG, WebP). However,their sophisticated network structures with cascaded convolution layers bring heavy computational burden for practical deployment. In this paper, we explore the structural sparsity in neural image compression network to obtain real-time acceleration without any specialized hardware design or algorithm. We propose a simple plug-in adaptive binary channel masking(ABCM) to judge the importance of each convolution channel and introduce sparsity during training. During inference, the unimportant channels are pruned to obtain slimmer network and less computation. We implement our method into three neural image compression networks with different entropy models to verify its effectiveness and generalization, the experiment results show that up to 7x computation reduction and 3x acceleration can be achieved with negligible performance drop.