arXiv reaDer
PPCD-GAN: Progressive Pruning and Class-Aware Distillation for Large-Scale Conditional GANs Compression
大規模な条件付き生成的敵対的ネットワーク(GAN)圧縮の新しい挑戦的なタスクを活用することにより、ニューラルネットワーク圧縮研究を推進します。この目的のために、プログレッシブ剪定残余ブロック(PP-Res)とクラス対応蒸留を導入することにより、徐々に縮小するGAN(PPCD-GAN)を提案します。 PP-Resは、従来の残余ブロックの拡張であり、各畳み込み層の後に学習可能なマスク層が続き、トレーニングが進むにつれてネットワークパラメーターを段階的に整理します。一方、クラスを意識した蒸留は、十分に訓練された教師モデルから有益な注意マップを介して膨大な知識を伝達することにより、訓練の安定性を高めます。剪定と蒸留のプロセスを、よく知られたGANアーキテクチャでエンドツーエンドの方法で同時にトレーニングします。トレーニング後、すべての冗長パラメータとマスクレイヤーが破棄され、パフォーマンスを維持しながらネットワークが軽量化されます。 ImageNet 128x128データセットで、PPCD-GANは、パフォーマンスを向上させながら、最先端のパラメーターに対して最大5.2x(81%)のパラメーターを削減することを包括的に示しています。
We push forward neural network compression research by exploiting a novel challenging task of large-scale conditional generative adversarial networks (GANs) compression. To this end, we propose a gradually shrinking GAN (PPCD-GAN) by introducing progressive pruning residual block (PP-Res) and class-aware distillation. The PP-Res is an extension of the conventional residual block where each convolutional layer is followed by a learnable mask layer to progressively prune network parameters as training proceeds. The class-aware distillation, on the other hand, enhances the stability of training by transferring immense knowledge from a well-trained teacher model through instructive attention maps. We train the pruning and distillation processes simultaneously on a well-known GAN architecture in an end-to-end manner. After training, all redundant parameters as well as the mask layers are discarded, yielding a lighter network while retaining the performance. We comprehensively illustrate, on ImageNet 128x128 dataset, PPCD-GAN reduces up to 5.2x (81%) parameters against state-of-the-arts while keeping better performance.
updated: Wed Mar 16 2022 08:26:05 GMT+0000 (UTC)
published: Wed Mar 16 2022 08:26:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト