arXiv reaDer
GhostNetV2: 長距離注意で安価な運用を強化
GhostNetV2: Enhance Cheap Operation with Long-Range Attention
軽量の畳み込みニューラル ネットワーク (CNN) は、推論速度が速いモバイル デバイス上のアプリケーション向けに特別に設計されています。畳み込み演算では、ウィンドウ領域内のローカル情報しか取得できないため、パフォーマンスをさらに向上させることができません。畳み込みに自己注意を導入すると、グローバルな情報をうまくキャプチャできますが、実際の速度が大幅に低下します。このホワイト ペーパーでは、ハードウェアに適したアテンション メカニズム (DFC アテンションと呼ばれる) を提案し、モバイル アプリケーション用の新しい GhostNetV2 アーキテクチャを紹介します。提案された DFC の注意は、完全に接続されたレイヤーに基づいて構築されます。これは、一般的なハードウェアで高速に実行できるだけでなく、長距離ピクセル間の依存関係をキャプチャすることもできます。以前の GhostNet の表現力のボトルネックをさらに再検討し、GhostNetV2 ブロックがローカル情報と長距離情報を同時に集約できるように、DFC の注意を払って安価な操作によって生成された拡張機能を強化することを提案します。広範な実験により、既存のアーキテクチャに対する GhostNetV2 の優位性が実証されています。たとえば、167M FLOP の ImageNet で 75.3% のトップ 1 精度を達成し、同様の計算コストで GhostNetV1 (74.5%) を大幅に抑制します。ソース コードは、https://github.com/huawei-noah/Efficient-AI-Backbones/tree/master/ghostnetv2_pytorch および https://gitee.com/mindspore/models/tree/master/research/cv で入手できます。 /ghostnetv2.
Light-weight convolutional neural networks (CNNs) are specially designed for applications on mobile devices with faster inference speed. The convolutional operation can only capture local information in a window region, which prevents performance from being further improved. Introducing self-attention into convolution can capture global information well, but it will largely encumber the actual speed. In this paper, we propose a hardware-friendly attention mechanism (dubbed DFC attention) and then present a new GhostNetV2 architecture for mobile applications. The proposed DFC attention is constructed based on fully-connected layers, which can not only execute fast on common hardware but also capture the dependence between long-range pixels. We further revisit the expressiveness bottleneck in previous GhostNet and propose to enhance expanded features produced by cheap operations with DFC attention, so that a GhostNetV2 block can aggregate local and long-range information simultaneously. Extensive experiments demonstrate the superiority of GhostNetV2 over existing architectures. For example, it achieves 75.3% top-1 accuracy on ImageNet with 167M FLOPs, significantly suppressing GhostNetV1 (74.5%) with a similar computational cost. The source code will be available at https://github.com/huawei-noah/Efficient-AI-Backbones/tree/master/ghostnetv2_pytorch and https://gitee.com/mindspore/models/tree/master/research/cv/ghostnetv2.
updated: Wed Nov 23 2022 12:16:59 GMT+0000 (UTC)
published: Wed Nov 23 2022 12:16:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト