arXiv reaDer
エッジデバイス用の効率的な多目的クロスアテンションベースの画像アライメントブロック
Efficient Multi-Purpose Cross-Attention Based Image Alignment Block for Edge Devices
画像レジストレーションとも呼ばれる画像アライメントは、多くのコンピュータビジョンの問題で使用される重要なブロックです。非効率的なアライナーは全体的な問題に大きなオーバーヘッドを引き起こす可能性があるため、アライナーの重要な要素の1つは効率です。文献では、ほとんどが効率に焦点を当てていませんが、位置合わせ操作を行うように見えるいくつかのブロックがあります。したがって、時間および/または空間の両方で機能し、エッジデバイスで機能できる画像位置合わせブロックは、複数の画像を処理するほとんどすべてのネットワークにとって有益です。その幅広い使用法と重要性を考慮して、エッジデバイス内での作業に適した効率的なクロスアテンションベースの多目的画像アライメントブロック(XABA)を提案します。クロスアテンションを使用して、画像から抽出された特徴間の関係を活用します。リアルタイムの画像アライメントの問題に対してクロスアテンションを実行可能にし、大きな動きを処理するために、ピラミッド型ブロックベースのクロスアテンションスキームを提供します。これにより、メモリ要件と操作数の削減に加えて、ローカル関係もキャプチャされます。効率的なXABAモデルは、他の強力なコンピューターと比較して、30Wの消費電力でNVIDIAJetsonXavierで20FPSを超えるパフォーマンスを実行するというリアルタイムの要件を実現します。大規模なネットワークでサブブロックとして使用されるXABAは、他の位置合わせ方法と比較して、マルチイメージの超解像ネットワークのパフォーマンスも向上させます。
Image alignment, also known as image registration, is a critical block used in many computer vision problems. One of the key factors in alignment is efficiency, as inefficient aligners can cause significant overhead to the overall problem. In the literature, there are some blocks that appear to do the alignment operation, although most do not focus on efficiency. Therefore, an image alignment block which can both work in time and/or space and can work on edge devices would be beneficial for almost all networks dealing with multiple images. Given its wide usage and importance, we propose an efficient, cross-attention-based, multi-purpose image alignment block (XABA) suitable to work within edge devices. Using cross-attention, we exploit the relationships between features extracted from images. To make cross-attention feasible for real-time image alignment problems and handle large motions, we provide a pyramidal block based cross-attention scheme. This also captures local relationships besides reducing memory requirements and number of operations. Efficient XABA models achieve real-time requirements of running above 20 FPS performance on NVIDIA Jetson Xavier with 30W power consumption compared to other powerful computers. Used as a sub-block in a larger network, XABA also improves multi-image super-resolution network performance in comparison to other alignment methods.
updated: Wed Jun 01 2022 07:51:35 GMT+0000 (UTC)
published: Wed Jun 01 2022 07:51:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト