arXiv reaDer
SufrinNet: 暗闇でのステレオ画像強化のための十分なクロスビュー インタラクションに向けて
SufrinNet: Toward Sufficient Cross-View Interaction for Stereo Image Enhancement in The Dark
ローライト ステレオ イメージ エンハンスメント (LLSIE) は、暗い状況でキャプチャされた視覚的に不快なステレオ イメージの品質を向上させるための比較的新しいタスクです。これまでのところ、ディープ LLSIE に関する研究は、特定の困難な問題、つまり、タスクが十分に対処されていないために調査されたものはほとんどなく、現在の方法には明らかに 2 つの不足があります。 2) ビュー内学習の長期依存性がない。したがって、この論文では、Sufficient Cross-View Interaction Network (SufrinNet) と呼ばれる新しい LLSIE モデルを提案します。具体的には、ビュー間の情報交換を強化するのに十分なビュー間相互作用モジュール (SIIM) を提示します。 SIIM は、さまざまなスケールでビュー間の相関関係を発見するだけでなく、スケール間の情報の相互作用も調査します。さらに、ビュー内特徴抽出のための空間チャネル情報マイニング ブロック (SIMB) を提示し、利点は 2 つあります。 1 つは、空間的な長距離関係を構築するための長距離依存関係の捕捉であり、もう 1 つは、チャネル次元での情報の流れを強化する拡張チャネル情報洗練です。 Flickr1024、KITTI 2012、KITTI 2015、Middlebury のデータセットに関する広範な実験では、他の関連する方法と比較して、私たちの方法がより優れた照明調整と詳細回復を実現し、SOTA パフォーマンスを達成することが示されています。私たちのコード、データセット、モデルは公開されます。
Low-light stereo image enhancement (LLSIE) is a relatively new task to enhance the quality of visually unpleasant stereo images captured in dark conditions. So far, very few studies on deep LLSIE have been explored due to certain challenging issues, i.e., the task has not been well addressed, and current methods clearly suffer from two shortages: 1) insufficient cross-view interaction; 2) lacking long-range dependency for intra-view learning. In this paper, we therefore propose a novel LLSIE model, termed Sufficient Cross-View Interaction Network (SufrinNet). To be specific, we present sufficient inter-view interaction module (SIIM) to enhance the information exchange across views. SIIM not only discovers the cross-view correlations at different scales, but also explores the cross-scale information interaction. Besides, we present a spatial-channel information mining block (SIMB) for intra-view feature extraction, and the benefits are twofold. One is the long-range dependency capture to build spatial long-range relationship, and the other is expanded channel information refinement that enhances information flow in channel dimension. Extensive experiments on Flickr1024, KITTI 2012, KITTI 2015 and Middlebury datasets show that our method obtains better illumination adjustment and detail recovery, and achieves SOTA performance compared to other related methods. Our codes, datasets and models will be publicly available.
updated: Fri Nov 04 2022 09:02:20 GMT+0000 (UTC)
published: Wed Nov 02 2022 04:01:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト