低消費電力デバイスに適したアプリケーションでディープニューラルネットワークがますます使用されるようになると、根本的なジレンマが明らかになります。傾向は、増加するデータを吸収するためにモデルを成長させ、メモリを集中的に使用することです。ただし、低電力デバイスは、大きなモデルを保存できない非常に限られたメモリで設計されています。パラメーターのプルーニングは、低電力デバイスでのモデルの深い展開に不可欠です。既存の取り組みは、主にネットワークの高効率構造の設計または冗長接続のプルーニングに重点を置いています。それらは通常、タスクに敏感であるか、専用の高価なハッシュストレージ戦略で中継します。この作業では、畳み込みカーネルの構造と効率的なストレージの再構築の観点から、軽量モデルを実現するための新しいアプローチを紹介します。私たちのアプローチは、従来のスクエアコンボリューションカーネルをラインセグメントに変換し、これらのラインセグメントを装備して多様な機能をモデル化するための適切な戦略を自動的に学習します。実験結果は、許容可能なパフォーマンスを維持しながら(DenseNet-40で69%を枝刈り)、計算(DenseNet-40で59%を枝刈り)を大幅に削減できることを示しています(精度は2%未満しか失われません)。
As deep neural networks are increasingly used in applications suited for low-power devices, a fundamental dilemma becomes apparent: the trend is to grow models to absorb increasing data that gives rise to memory intensive; however low-power devices are designed with very limited memory that can not store large models. Parameters pruning is critical for deep model deployment on low-power devices. Existing efforts mainly focus on designing highly efficient structures or pruning redundant connections for networks. They are usually sensitive to the tasks or relay on dedicated and expensive hashing storage strategies. In this work, we introduce a novel approach for achieving a lightweight model from the views of reconstructing the structure of convolutional kernels and efficient storage. Our approach transforms a traditional square convolution kernel to line segments, and automatically learn a proper strategy for equipping these line segments to model diverse features. The experimental results indicate that our approach can massively reduce the number of parameters (pruned 69% on DenseNet-40) and calculations (pruned 59% on DenseNet-40) while maintaining acceptable performance (only lose less than 2% accuracy).