arXiv reaDer
自己監視単眼深度推定のための残差ガイド学習表現
Residual-Guided Learning Representation for Self-Supervised Monocular Depth Estimation
測光の一貫性の損失は、自己監視単眼深度推定に一般的に使用される代表的な目的関数の1つです。ただし、この損失により、ガイダンスが正しくないために、テクスチャのない領域または遮蔽された領域で不安定な深度予測が発生することがよくあります。最近の自己監視学習アプローチは、オートエンコーダから明示的に学習された特徴表現を利用することでこの問題に取り組み、入力画像よりも優れた識別可能性を期待しています。自動エンコードされた機能を使用しているにもかかわらず、この方法では自動エンコードされた機能ほど識別力のある機能が埋め込まれていないことがわかります。本論文では、深度推定ネットワークが自動符号化特徴の識別可能性を転送することによって識別特徴を埋め込むことを可能にする残差ガイダンス損失を提案する。 KITTIベンチマークで実験を行い、他の最先端のメソッドに対するメソッドの優位性と直交性を検証しました。
Photometric consistency loss is one of the representative objective functions commonly used for self-supervised monocular depth estimation. However, this loss often causes unstable depth predictions in textureless or occluded regions due to incorrect guidance. Recent self-supervised learning approaches tackle this issue by utilizing feature representations explicitly learned from auto-encoders, expecting better discriminability than the input image. Despite the use of auto-encoded features, we observe that the method does not embed features as discriminative as auto-encoded features. In this paper, we propose residual guidance loss that enables the depth estimation network to embed the discriminative feature by transferring the discriminability of auto-encoded features. We conducted experiments on the KITTI benchmark and verified our method's superiority and orthogonality on other state-of-the-art methods.
updated: Mon Nov 08 2021 07:44:31 GMT+0000 (UTC)
published: Mon Nov 08 2021 07:44:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト