arXiv reaDer
ビデオブレ除去用のフローガイドスパーストランスフォーマー
Flow-Guided Sparse Transformer for Video Deblurring
時空間近傍で類似したより鮮明なシーンパッチを利用することは、ビデオのぼけ除去にとって重要です。ただし、CNNベースの方法では、長距離の依存関係をキャプチャし、非局所的な自己相似性をモデル化する際に制限があります。この論文では、ビデオのぼけ除去のための新しいフレームワーク、フローガイドスパーストランスフォーマー(FGST)を提案します。 FGSTでは、セルフアテンションモジュールであるフローガイドスパースウィンドウベースのマルチヘッドセルフアテンション(FGSW-MSA)をカスタマイズします。ぼやけた参照フレーム上のクエリ要素ごとに、FGSW-MSAは推定オプティカルフローのガイダンスを利用して、隣接するフレームの同じシーンパッチに対応する空間的にスパースでありながら関連性の高い主要要素をグローバルにサンプリングします。さらに、過去のフレームから情報を転送し、長距離の時間依存性を強化するためのRecurrent Embedding(RE)メカニズムを紹介します。包括的な実験により、提案されたFGSTは、DVDとGOPROの両方のデータセットで最先端の(SOTA)手法よりも優れており、実際のビデオのぼけ除去において、より視覚的に満足のいく結果が得られることが実証されています。コードとモデルは一般に公開されます。
Exploiting similar and sharper scene patches in spatio-temporal neighborhoods is critical for video deblurring. However, CNN-based methods show limitations in capturing long-range dependencies and modeling non-local self-similarity. In this paper, we propose a novel framework, Flow-Guided Sparse Transformer (FGST), for video deblurring. In FGST, we customize a self-attention module, Flow-Guided Sparse Window-based Multi-head Self-Attention (FGSW-MSA). For each query element on the blurry reference frame, FGSW-MSA enjoys the guidance of the estimated optical flow to globally sample spatially sparse yet highly related key elements corresponding to the same scene patch in neighboring frames. Besides, we present a Recurrent Embedding (RE) mechanism to transfer information from past frames and strengthen long-range temporal dependencies. Comprehensive experiments demonstrate that our proposed FGST outperforms state-of-the-art (SOTA) methods on both DVD and GOPRO datasets and even yields more visually pleasing results in real video deblurring. Code and models will be released to the public.
updated: Thu Jan 06 2022 02:05:32 GMT+0000 (UTC)
published: Thu Jan 06 2022 02:05:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト