arXiv reaDer
ViTA: エッジ アプリケーション向けのビジョン トランスフォーマー推論アクセラレータ
ViTA: A Vision Transformer Inference Accelerator for Edge Applications
ViT、Swin Transformer、Transformer-in-Transformer などのビジョン トランスフォーマー モデルは、優れたパフォーマンスにつながる機能間のグローバルな関係をキャプチャする能力により、コンピューター ビジョン タスクで最近大きな注目を集めています。ただし、それらは計算量が多く、リソースに制約のあるエッジ デバイスに展開するのは困難です。密接に関連する BERT Transformer モデルのハードウェア アクセラレータを含む既存のハードウェア アクセラレータは、リソースが非常に制約された環境を対象としていません。このホワイト ペーパーでは、このギャップに対処し、ViTA を提案します。ViTA は、ビジョン トランスフォーマー モデルを推論するための構成可能なハードウェア アクセラレータであり、リソースに制約のあるエッジ コンピューティング デバイスを対象とし、オフチップ メモリ アクセスの繰り返しを回避します。ヘッドレベルのパイプラインとレイヤー間 MLP 最適化を採用し、制御ロジックのみを変更することで、一般的に使用されるいくつかのビジョン トランスフォーマー モデルをサポートできます。ほとんどのビジョン トランスフォーマー モデルでほぼ 90% のハードウェア使用効率を達成し、150 MHz のクロックで合成すると 0.88W の電力を報告し、妥当なフレーム レートを取得します。これらすべてが、ViTA をエッジ アプリケーションに適したものにしています。
Vision Transformer models, such as ViT, Swin Transformer, and Transformer-in-Transformer, have recently gained significant traction in computer vision tasks due to their ability to capture the global relation between features which leads to superior performance. However, they are compute-heavy and difficult to deploy in resource-constrained edge devices. Existing hardware accelerators, including those for the closely-related BERT transformer models, do not target highly resource-constrained environments. In this paper, we address this gap and propose ViTA - a configurable hardware accelerator for inference of vision transformer models, targeting resource-constrained edge computing devices and avoiding repeated off-chip memory accesses. We employ a head-level pipeline and inter-layer MLP optimizations, and can support several commonly used vision transformer models with changes solely in our control logic. We achieve nearly 90% hardware utilization efficiency on most vision transformer models, report a power of 0.88W when synthesised with a clock of 150 MHz, and get reasonable frame rates - all of which makes ViTA suitable for edge applications.
updated: Fri Feb 17 2023 19:35:36 GMT+0000 (UTC)
published: Fri Feb 17 2023 19:35:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト