arXiv reaDer
ビデオシャドウ検出のための時間的特徴ワーピング
Temporal Feature Warping for Video Shadow Detection
単一画像の影の検出は近年急速に改善されていますが、ビデオの影の検出は、データの不足と時間的一貫性のモデル化が難しいため、依然として困難な作業です。現在のビデオシャドウ検出方法は、時間的にコヒーレントであるが、移動するシャドウや小さなシャドウ領域の検出には堅牢ではない情報を主に利用する共同注意によってこの目標を達成します。この論文では、情報を時間的により適切に集約するためのシンプルで強力な方法を提案します。オプティカルフローベースのワーピングモジュールを使用して、フレーム間でフィーチャを位置合わせして結合します。このワーピングモジュールを複数のディープネットワークレイヤーに適用して、ローカルの詳細と高レベルのセマンティック情報の両方を含む情報を隣接するフレームから取得します。 ViShaデータセットでフレームワークをトレーニングおよびテストします。実験結果は、私たちのモデルが最先端のビデオシャドウ検出方法を28%上回り、BERを16.7から12.0に削減することを示しています。
While single image shadow detection has been improving rapidly in recent years, video shadow detection remains a challenging task due to data scarcity and the difficulty in modelling temporal consistency. The current video shadow detection method achieves this goal via co-attention, which mostly exploits information that is temporally coherent but is not robust in detecting moving shadows and small shadow regions. In this paper, we propose a simple but powerful method to better aggregate information temporally. We use an optical flow based warping module to align and then combine features between frames. We apply this warping module across multiple deep-network layers to retrieve information from neighboring frames including both local details and high-level semantic information. We train and test our framework on the ViSha dataset. Experimental results show that our model outperforms the state-of-the-art video shadow detection method by 28%, reducing BER from 16.7 to 12.0.
updated: Thu Jul 29 2021 19:12:50 GMT+0000 (UTC)
published: Thu Jul 29 2021 19:12:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト