arXiv reaDer
モデル圧縮における分類精度メトリックを超えて
Going Beyond Classification Accuracy Metrics in Model Compression
エッジコンピューティングデバイスの台頭に伴い、エネルギーとリソース効率の高いモデルを展開する需要が高まっています。トップ1の精度などの標準的な指標に影響を与えることなく、モデルのサイズを大幅に縮小できる方法の開発に多くの研究が費やされてきました。ただし、これらのプルーニングアプローチでは、クラス間の公平性や説明性など、他の指標に重大な不一致が生じる傾向があります。このような不整合と戦うために、知識蒸留の文献に触発された新しいマルチパート損失関数を提案します。広範な実験を通じて、さまざまな圧縮アルゴリズム、アーキテクチャ、タスク、およびデータセットにわたるアプローチの有効性を示します。特に、圧縮モデルと参照モデルの間の予測の不一致の数が最大4.1倍減少し、参照モデルが正しい予測を行う場合は最大5.7倍減少します。圧縮アルゴリズムに変更を加えず、損失関数にわずかな変更を加えます。さらに、モデルの予測間に単純なアラインメントを導入することで、公平性や帰属を含む他のメトリックのアラインメントが自然に改善されることを示します。したがって、私たちのフレームワークは、将来、圧縮アルゴリズムの単純なプラグアンドプレイコンポーネントとして機能することができます。
With the rise in edge-computing devices, there has been an increasing demand to deploy energy and resource-efficient models. A large body of research has been devoted to developing methods that can reduce the size of the model considerably without affecting the standard metrics such as top-1 accuracy. However, these pruning approaches tend to result in a significant mismatch in other metrics such as fairness across classes and explainability. To combat such misalignment, we propose a novel multi-part loss function inspired by the knowledge-distillation literature. Through extensive experiments, we demonstrate the effectiveness of our approach across different compression algorithms, architectures, tasks as well as datasets. In particular, we obtain up to 4.1× reduction in the number of prediction mismatches between the compressed and reference models, and up to 5.7× in cases where the reference model makes the correct prediction; all while making no changes to the compression algorithm, and minor modifications to the loss function. Furthermore, we demonstrate how inducing simple alignment between the predictions of the models naturally improves the alignment on other metrics including fairness and attributions. Our framework can thus serve as a simple plug-and-play component for compression algorithms in the future.
updated: Mon Jun 14 2021 20:10:09 GMT+0000 (UTC)
published: Thu Dec 03 2020 00:00:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト