本論文では、畳み込みニューラルネットワークの微分可能チャネル剪定検索(DCPS)を提案します。ユーザーが各畳み込み層のプルーニング比を手動で設定する必要がある従来のチャネルプルーニングアルゴリズムとは異なり、DCPSはプルーニング比の最適な組み合わせを自動的に検索します。微分可能アーキテクチャ検索(DARTS)に触発されて、継続的な緩和から教訓を引き出し、勾配情報を活用してメトリックとパフォーマンスのバランスを取ります。ただし、DARTSスキームを直接適用すると、チャネルの不一致の問題と大量のメモリ消費が発生します。したがって、ごくわずかな追加リソースで形状の不一致の問題をエレガントに排除できる新しいウェイトシェアリング手法を紹介します。提案されたアルゴリズムを画像分類タスクでテストし、CIFAR-10、CIFAR-100、およびImageNetでの画像分類の最先端の剪定結果を達成します。 DCPSは、PASCAL VOC2012のセマンティックセグメンテーションに2つの目的でさらに利用されます。 1つは、タスク固有のチャネルプルーニングがスリムモデルの転送に対してより優れたパフォーマンスを実現することを実証することです。2つ目は、タスクが分類よりも多くのメモリバジェットを必要とするため、DCPSのメモリ効率を証明することです。実験の結果は、DCPSの有効性と幅広い適用性を検証します。
In this paper, we propose the differentiable channel pruning search (DCPS) of convolutional neural networks. Unlike traditional channel pruning algorithms which require users to manually set prune ratio for each convolutional layer, DCPS search the optimal combination of prune ratio that automatically. Inspired by the differentiable architecture search (DARTS), we draws lessons from the continuous relaxation and leverages the gradient information to balance the metrics and performance. However, directly applying the DARTS scheme will cause channel mismatching problem and huge memory consumption. Therefore, we introduce a novel weight sharing technique which can elegantly eliminate the shape mismatching problem with negligible additional resource. We test the proposed algorithm on image classification task and it achieves the state-of-the-art pruning results for image classification on CIFAR-10, CIFAR-100 and ImageNet. DCPS is further utilized for semantic segmentation on PASCAL VOC 2012 for two purposes. The first is to demonstrate that task-specific channel pruning achieves better performance against transferring slim models, and the second is to prove the memory efficiency of DCPS as the task demand more memory budget than classification. Results of the experiments validate the effectiveness and wide applicability of DCPS.