arXiv reaDer
DRO: Video to Depth の Deep Recurrent Optimizer
DRO: Deep Recurrent Optimizer for Video to Depth
機械学習技術を使用してビデオ ツー デプス (V2D) の問題を研究することへの関心が高まっています。以前の方法では、画像からデプス マップおよびカメラ ポーズへのマッピングを直接学習していましたが、最近の研究では、学習フレームワークに組み込まれた最適化を通じて、マルチビュー ジオメトリの制約を適用しています。この論文では、V2D におけるニューラル ネットワークの可能性をさらに活用するために、リカレント ニューラル ネットワークに基づく新しい最適化手法を紹介します。具体的には、ニューラル オプティマイザーは、繰り返しを通じて深度とカメラの姿勢を交互に更新して、特徴量のコストを最小限に抑え、2 つのゲート付き反復ユニットが履歴情報を追跡することで結果を繰り返し改善します。広範な実験結果は、私たちの方法が以前の方法よりも優れており、コストボリュームベースの方法よりも計算とメモリ消費においてより効率的であることを示しています。特に、自己教師ありメソッドは、KITTI および ScanNet データセットに対する以前の教師ありメソッドよりも優れています。ソース コードは https://github.com/aliyun/dro-sfm で入手できます。
There are increasing interests of studying the video-to-depth (V2D) problem with machine learning techniques. While earlier methods directly learn a mapping from images to depth maps and camera poses, more recent works enforce multi-view geometry constraints through optimization embedded in the learning framework. This paper presents a novel optimization method based on recurrent neural networks to further exploit the potential of neural networks in V2D. Specifically, our neural optimizer alternately updates the depth and camera poses through iterations to minimize a feature-metric cost, and two gated recurrent units iteratively improve the results by tracing historical information. Extensive experimental results demonstrate that our method outperforms previous methods and is more efficient in computation and memory consumption than cost-volume-based methods. In particular, our self-supervised method outperforms previous supervised methods on the KITTI and ScanNet datasets. Our source code is available at https://github.com/aliyun/dro-sfm.
updated: Tue Mar 07 2023 09:44:23 GMT+0000 (UTC)
published: Wed Mar 24 2021 13:59:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト