arXiv reaDer
NeW CRF:単眼深度推定のためのニューラルウィンドウ完全接続CRF
NeW CRFs: Neural Window Fully-connected CRFs for Monocular Depth Estimation
単一の画像から正確な深度を推定することは、本質的にあいまいで適切でないため、困難です。最近の作品は、深度マップを直接回帰するためにますます複雑で強力なネットワークを設計していますが、CRF最適化の道を歩んでいます。計算にコストがかかるため、CRFは通常、グラフ全体ではなく近隣間で実行されます。完全に接続されたCRFの可能性を活用するために、入力をウィンドウに分割し、各ウィンドウ内でFC-CRFの最適化を実行します。これにより、計算の複雑さが軽減され、FC-CRFが実現可能になります。グラフ内のノード間の関係をより適切にキャプチャするために、マルチヘッドアテンションメカニズムを利用してマルチヘッドポテンシャル関数を計算します。この関数はネットワークに供給され、最適化された深度マップを出力します。次に、ボトムアップトップダウン構造を構築します。この構造では、このニューラルウィンドウFC-CRFモジュールがデコーダーとして機能し、ビジョントランスフォーマーがエンコーダーとして機能します。実験は、私たちの方法が、以前の方法と比較して、KITTIとNYUv2の両方のデータセットのすべてのメトリックにわたってパフォーマンスを大幅に改善することを示しています。さらに、提案された方法はパノラマ画像に直接適用でき、MatterPort3Dデータセットの以前のすべてのパノラマ方法よりも優れています。メソッドのソースコードは公開されます。
Estimating the accurate depth from a single image is challenging since it is inherently ambiguous and ill-posed. While recent works design increasingly complicated and powerful networks to directly regress the depth map, we take the path of CRFs optimization. Due to the expensive computation, CRFs are usually performed between neighborhoods rather than the whole graph. To leverage the potential of fully-connected CRFs, we split the input into windows and perform the FC-CRFs optimization within each window, which reduces the computation complexity and makes FC-CRFs feasible. To better capture the relationships between nodes in the graph, we exploit the multi-head attention mechanism to compute a multi-head potential function, which is fed to the networks to output an optimized depth map. Then we build a bottom-up-top-down structure, where this neural window FC-CRFs module serves as the decoder, and a vision transformer serves as the encoder. The experiments demonstrate that our method significantly improves the performance across all metrics on both the KITTI and NYUv2 datasets, compared to previous methods. Furthermore, the proposed method can be directly applied to panorama images and outperforms all previous panorama methods on the MatterPort3D dataset. The source code of our method will be made public.
updated: Thu Mar 03 2022 03:27:20 GMT+0000 (UTC)
published: Thu Mar 03 2022 03:27:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト