arXiv reaDer
変形可能な注意ピラミッドによる高速オンラインビデオ超解像
Fast Online Video Super-Resolution with Deformable Attention Pyramid
ビデオ超解像(VSR)には、ビデオストリーミングやテレビなど、厳密な因果関係、リアルタイム、および遅延の制約をもたらす多くのアプリケーションがあります。これらの設定でVSRの問題に対処します。これは、将来のフレームからの情報が利用できないため、追加の重要な課題をもたらします。重要なのは、効率的でありながら効果的なフレームアライメントとフュージョンモジュールの設計が依然として中心的な問題であるということです。この作業では、変形可能な注意ピラミッド(DAP)に基づく反復VSRアーキテクチャを提案します。私たちのDAPは、再発状態からの情報を現在のフレーム予測に合わせて統合します。従来の注意ベースの方法の計算コストを回避するために、DAPによって動的に予測される限られた数の空間位置にのみ注意を払います。提案された主要な革新の包括的な実験と分析は、私たちのアプローチの有効性を示しています。高性能を維持しながら、最先端の方法と比較して処理時間を大幅に短縮します。 3倍以上のスピードアップで2つの標準ベンチマークで最先端の方法EDVR-Mを上回ります。
Video super-resolution (VSR) has many applications that pose strict causal, real-time, and latency constraints, including video streaming and TV. We address the VSR problem under these settings, which poses additional important challenges since information from future frames are unavailable. Importantly, designing efficient, yet effective frame alignment and fusion modules remain central problems. In this work, we propose a recurrent VSR architecture based on a deformable attention pyramid (DAP). Our DAP aligns and integrates information from the recurrent state into the current frame prediction. To circumvent the computational cost of traditional attention-based methods, we only attend to a limited number of spatial locations, which are dynamically predicted by the DAP. Comprehensive experiments and analysis of the proposed key innovations show the effectiveness of our approach. We significantly reduce processing time in comparison to state-of-the-art methods, while maintaining a high performance. We surpass state-of-the-art method EDVR-M on two standard benchmarks with a speed-up of over 3x.
updated: Thu Feb 03 2022 17:49:04 GMT+0000 (UTC)
published: Thu Feb 03 2022 17:49:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト