arXiv reaDer
TopFormer:モバイルセマンティックセグメンテーション用のトークンピラミッドトランスフォーマー
TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation
ビジョントランスフォーマー(ViT)は、コンピュータービジョンで大きな成功を収めていますが、計算コストが高いため、モバイルデバイスでのセマンティックセグメンテーションなどの高密度予測タスクへのアプリケーションが妨げられています。このホワイトペーパーでは、Token Pyramid Vision Transformer(TopFormer)という名前のモバイルフレンドリーなアーキテクチャを紹介します。提案されたTopFormerは、さまざまなスケールからトークンを入力として受け取り、スケール対応のセマンティック機能を生成します。これは、対応するトークンに注入されて、表現を拡張します。実験結果は、私たちの方法がいくつかのセマンティックセグメンテーションデータセット全体でCNNベースおよびViTベースのネットワークを大幅に上回り、精度と遅延の間の適切なトレードオフを達成することを示しています。 ADE20Kデータセットでは、TopFormerはMobileNetV3よりもmIoUで5%高い精度を達成し、ARMベースのモバイルデバイスでは待ち時間が短くなります。さらに、TopFormerの小さなバージョンは、ARMベースのモバイルデバイスでリアルタイムの推論を実現し、競争力のある結果をもたらします。コードとモデルは、https://github.com/hustvl/TopFormerで入手できます。
Although vision transformers (ViTs) have achieved great success in computer vision, the heavy computational cost hampers their applications to dense prediction tasks such as semantic segmentation on mobile devices. In this paper, we present a mobile-friendly architecture named Token Pyramid Vision Transformer (TopFormer). The proposed TopFormer takes Tokens from various scales as input to produce scale-aware semantic features, which are then injected into the corresponding tokens to augment the representation. Experimental results demonstrate that our method significantly outperforms CNN- and ViT-based networks across several semantic segmentation datasets and achieves a good trade-off between accuracy and latency. On the ADE20K dataset, TopFormer achieves 5% higher accuracy in mIoU than MobileNetV3 with lower latency on an ARM-based mobile device. Furthermore, the tiny version of TopFormer achieves real-time inference on an ARM-based mobile device with competitive results. The code and models are available at: https://github.com/hustvl/TopFormer
updated: Tue Apr 12 2022 04:51:42 GMT+0000 (UTC)
published: Tue Apr 12 2022 04:51:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト