arXiv reaDer
効率的な注意ベースのモデルのためのモバイル ブロックの再考
Rethinking Mobile Block for Efficient Attention-based Models
このペーパーでは、パラメーター、FLOP、パフォーマンスをトレードオフしながら、高密度予測のための最新の効率的で軽量なモデルを開発することに焦点を当てています。 Inverted Residual Block (IRB) は軽量 CNN のインフラストラクチャとして機能しますが、対応するものはアテンションベースの研究では認識されていません。この研究では、統合された観点から効率的な IRB と Transformer の効果的なコンポーネントから軽量インフラストラクチャを再考し、CNN ベースの IRB をアテンションベースのモデルに拡張し、軽量モデル設計のための 1 残差メタ モバイル ブロック (MMB) を抽象化します。シンプルだが効果的な設計基準に従って、最新の反転残差モバイル ブロック (iRMB) を推定し、ダウンストリーム タスク用に iRMB のみを使用して ResNet のような効率モデル (EMO) を構築します。 ImageNet-1K、COCO2017、および ADE20K ベンチマークに関する広範な実験により、最先端の手法に対する当社の EMO の優位性が実証されています。たとえば、EMO-1M/2M/5M は、同等のベンチマークを上回る 71.5、75.1、および 78.4 Top-1 を達成しています。 -パラメータ、効率、精度を適切にトレードオフしながら、CNN/アテンションベースのモデルを注文します。iPhone14 では EdgeNeXt よりも 2.8 ~ 4.0 倍高速に実行されます。
This paper focuses on developing modern, efficient, lightweight models for dense predictions while trading off parameters, FLOPs, and performance. Inverted Residual Block (IRB) serves as the infrastructure for lightweight CNNs, but no counterpart has been recognized by attention-based studies. This work rethinks lightweight infrastructure from efficient IRB and effective components of Transformer from a unified perspective, extending CNN-based IRB to attention-based models and abstracting a one-residual Meta Mobile Block (MMB) for lightweight model design. Following simple but effective design criterion, we deduce a modern Inverted Residual Mobile Block (iRMB) and build a ResNet-like Efficient MOdel (EMO) with only iRMB for down-stream tasks. Extensive experiments on ImageNet-1K, COCO2017, and ADE20K benchmarks demonstrate the superiority of our EMO over state-of-the-art methods, e.g., EMO-1M/2M/5M achieve 71.5, 75.1, and 78.4 Top-1 that surpass equal-order CNN-/Attention-based models, while trading-off the parameter, efficiency, and accuracy well: running 2.8-4.0x faster than EdgeNeXt on iPhone14.
updated: Mon Aug 14 2023 08:54:43 GMT+0000 (UTC)
published: Tue Jan 03 2023 15:11:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト