arXiv reaDer
統合された組み込み関数と時空間制約を使用した教師なし単眼深度学習
Unsupervised Monocular Depth Learning with Integrated Intrinsics and Spatio-Temporal Constraints
単眼深度推論は、近年、研究者から大きな注目を集めており、高価な飛行時間型センサーの有望な代替品として残っていますが、スケールの取得と実装のオーバーヘッドに関する問題は、依然としてこれらのシステムを悩ませています。この目的のために、この作品は、単一のネットワークを介して単眼画像のシーケンスから、カメラの本質に加えて、大規模な深度マップと自我運動を予測することができる教師なし学習フレームワークを提示します。私たちの方法は、深さとポーズのスケール係数を解決するために空間的および時間的幾何学的制約の両方を組み込んでいます。これらはトレーニング時に監視再構成損失関数内で適用されます。単一ネットワークアーキテクチャの重みをトレーニングするために必要なのは、ラベルのないステレオシーケンスのみです。これにより、以前の方法と比較して、全体的な実装オーバーヘッドが削減されます。私たちの結果は、KITTI駆動データセットの複数のシーケンスで現在の最先端技術と比較した場合に強力なパフォーマンスを示しています。
Monocular depth inference has gained tremendous attention from researchers in recent years and remains as a promising replacement for expensive time-of-flight sensors, but issues with scale acquisition and implementation overhead still plague these systems. To this end, this work presents an unsupervised learning framework that is able to predict at-scale depth maps and egomotion, in addition to camera intrinsics, from a sequence of monocular images via a single network. Our method incorporates both spatial and temporal geometric constraints to resolve depth and pose scale factors, which are enforced within the supervisory reconstruction loss functions at training time. Only unlabeled stereo sequences are required for training the weights of our single-network architecture, which reduces overall implementation overhead as compared to previous methods. Our results demonstrate strong performance when compared to the current state-of-the-art on multiple sequences of the KITTI driving dataset.
updated: Mon Nov 02 2020 22:26:58 GMT+0000 (UTC)
published: Mon Nov 02 2020 22:26:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト