arXiv reaDer
きめの細かいマニホールド蒸留による効率的なビジョントランスフォーマーの学習
Learning Efficient Vision Transformers via Fine-Grained Manifold Distillation
過去数年間で、変圧器はさまざまなコンピュータービジョンタスクで有望なパフォーマンスを達成してきました。残念ながら、ほとんどの既存のビジョントランスフォーマーの膨大な推論オーバーヘッドは、携帯電話やスマートウォッチなどのエッジデバイスへの展開を妨げています。知識の蒸留は、コンパクトな学生に情報を転送することで面倒なアーキテクチャを圧縮するために広く使用されているパラダイムです。ただし、それらのほとんどは畳み込みニューラルネットワーク(CNN)用に設計されており、ビジョントランスフォーマー(ViT)の特性を完全には調査していません。本論文では、パッチレベルの情報を利用し、細粒マニホルド蒸留法を提案した。具体的には、パッチレベルのマニフォールドスペースで事前にトレーニングされた教師モデルと一致するように、小さな学生モデルをトレーニングします。次に、パッチ関係の計算コストをさらに削減するために、慎重に設計して、マニホールドのマッチング損失を3つの項に分離します。提案された方法を備えた、5Mパラメータを含むDeiT-Tinyモデルは、ImageNet-1kで76.5%のトップ1精度を達成します。これは、以前の蒸留アプローチよりも+ 2.0%高くなっています。他の分類ベンチマークおよびダウンストリームビジョンタスクでの学習結果の転送も、最先端のアルゴリズムに対する私たちの方法の優位性を示しています。
In the past few years, transformers have achieved promising performances on various computer vision tasks. Unfortunately, the immense inference overhead of most existing vision transformers withholds their from being deployed on edge devices such as cell phones and smart watches. Knowledge distillation is a widely used paradigm for compressing cumbersome architectures via transferring information to a compact student. However, most of them are designed for convolutional neural networks (CNNs), which do not fully investigate the character of vision transformer (ViT). In this paper, we utilize the patch-level information and propose a fine-grained manifold distillation method. Specifically, we train a tiny student model to match a pre-trained teacher model in the patch-level manifold space. Then, we decouple the manifold matching loss into three terms with careful design to further reduce the computational costs for the patch relationship. Equipped with the proposed method, a DeiT-Tiny model containing 5M parameters achieves 76.5% top-1 accuracy on ImageNet-1k, which is +2.0% higher than previous distillation approaches. Transfer learning results on other classification benchmarks and downstream vision tasks also demonstrate the superiority of our method over the state-of-the-art algorithms.
updated: Thu Jun 02 2022 12:16:28 GMT+0000 (UTC)
published: Sat Jul 03 2021 08:28:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト