arXiv reaDer
Joslim:スリム化可能なニューラルネットワークのためのジョイントの幅と重みの最適化
Joslim: Joint Widths and Weights Optimization for Slimmable Neural Networks
スリム化可能なニューラルネットワークは、単一モデルと同じストレージ要件で、予測エラーと計算要件(浮動小数点演算やFLOPの数など)の間の柔軟なトレードオフフロントを提供します。これらは、メモリの制約が異なるデバイスにモデルをデプロイするためのメンテナンスオーバーヘッドを削減するのに役立ち、多くのCNNを備えたシステムの効率を最適化するのに役立ちます。ただし、既存のスリマブルネットワークアプローチは、レイヤーごとの幅を最適化しないか、共有ウェイトとレイヤーごとの幅を個別に最適化しないため、ジョイント幅とウェイトの最適化による改善の余地が大幅に残ります。この作業では、スリム化可能なネットワークの幅構成と重みの両方のジョイント最適化を可能にする一般的なフレームワークを提案します。私たちのフレームワークは、特殊なケースとして従来のNASベースのスリム化可能な方法を包含し、既存の方法を改善するための柔軟性を提供します。実用的な観点から、スリム化可能なネットの幅と重みの両方を共同で最適化するアルゴリズムであるJoslimを提案します。これは、さまざまなネットワーク、データセット、および目的にわたってスリム化可能なネットワークを最適化する既存の方法よりも優れています。定量的には、ImageNetデータセットのトップ1の精度で最大1.7%と8%の改善が、FLOPとメモリフットプリントを考慮してMobileNetV2でそれぞれ達成できます。私たちの結果は、スリム化可能なネットワークの重みとともに、さまざまなレイヤーのチャネル数を最適化する可能性を浮き彫りにしています。コードはhttps://github.com/cmu-enyac/Joslimで入手できます。
Slimmable neural networks provide a flexible trade-off front between prediction error and computational requirement (such as the number of floating-point operations or FLOPs) with the same storage requirement as a single model. They are useful for reducing maintenance overhead for deploying models to devices with different memory constraints and are useful for optimizing the efficiency of a system with many CNNs. However, existing slimmable network approaches either do not optimize layer-wise widths or optimize the shared-weights and layer-wise widths independently, thereby leaving significant room for improvement by joint width and weight optimization. In this work, we propose a general framework to enable joint optimization for both width configurations and weights of slimmable networks. Our framework subsumes conventional and NAS-based slimmable methods as special cases and provides flexibility to improve over existing methods. From a practical standpoint, we propose Joslim, an algorithm that jointly optimizes both the widths and weights for slimmable nets, which outperforms existing methods for optimizing slimmable networks across various networks, datasets, and objectives. Quantitatively, improvements up to 1.7% and 8% in top-1 accuracy on the ImageNet dataset can be attained for MobileNetV2 considering FLOPs and memory footprint, respectively. Our results highlight the potential of optimizing the channel counts for different layers jointly with the weights for slimmable networks. Code available at https://github.com/cmu-enyac/Joslim.
updated: Wed Jun 30 2021 14:38:29 GMT+0000 (UTC)
published: Thu Jul 23 2020 02:05:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト