arXiv reaDer
ロバストな自己教師あり単眼深度推定のための画像マスキング
Image Masking for Robust Self-Supervised Monocular Depth Estimation
自己教師あり単眼深度推定は、3D シーンを理解するための重要なタスクです。単眼自我運動推定と一緒に学習され、ラベル付きデータを使用せずに正確なピクセル単位の深度を予測するいくつかの方法が提案されています。それにもかかわらず、これらの方法は、自然またはデジタルの破損のない理想的な条件下でのパフォーマンスの向上に焦点を当てています.オブジェクト固有の深度推定の場合でも、オクルージョンは一般的に存在しないと想定されます。これらの方法は敵対的な攻撃に対しても脆弱であり、これはロボットや自動運転システムでの信頼性の高い展開に関連する懸念事項です。 MIMDepth は、マスクされた画像モデリング (MIM) を自己教師あり単眼深度推定に適応させる方法です。 MIM は、事前トレーニング中に一般化可能な機能を学習するために使用されてきましたが、単眼深度推定の直接トレーニングにどのように適応できるかを示します。私たちの実験では、MIMDepth は、ノイズ、ぼかし、気象条件、デジタル アーティファクト、オクルージョン、および非標的型および標的型の敵対的攻撃に対してより堅牢であることが示されています。
Self-supervised monocular depth estimation is a salient task for 3D scene understanding. Learned jointly with monocular ego-motion estimation, several methods have been proposed to predict accurate pixel-wise depth without using labeled data. Nevertheless, these methods focus on improving performance under ideal conditions without natural or digital corruptions. The general absence of occlusions is assumed even for object-specific depth estimation. These methods are also vulnerable to adversarial attacks, which is a pertinent concern for their reliable deployment in robots and autonomous driving systems. We propose MIMDepth, a method that adapts masked image modeling (MIM) for self-supervised monocular depth estimation. While MIM has been used to learn generalizable features during pre-training, we show how it could be adapted for direct training of monocular depth estimation. Our experiments show that MIMDepth is more robust to noise, blur, weather conditions, digital artifacts, occlusions, as well as untargeted and targeted adversarial attacks.
updated: Wed Feb 01 2023 13:51:07 GMT+0000 (UTC)
published: Wed Oct 05 2022 15:57:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト