深度推定機能は、3D認識に役立ちます。商品グレードの深度カメラは、深度とカラー画像をリアルタイムでキャプチャできます。ただし、光沢のある、透明または遠方の表面は、センサーで適切にスキャンできません。結果として、深度の検知からの強化と復元は重要なタスクです。深さ補完は、センサーが検出できない穴を埋めることを目的としています。これは、機械が学習するための複雑なタスクです。従来の手で調整された方法は限界に達しましたが、ニューラルネットワークベースの方法は、周囲の深度値からの出力をコピーして補間する傾向があります。これにより、境界がぼやけ、デプスマップの構造が失われます。その結果、私たちの主な仕事は、エッジの明瞭さを維持しながら、完了深度マップを改善するエンドツーエンドネットワークを設計することです。以前は画像修復フィールドで使用されていた自己注意メカニズムを利用して、畳み込みの各レイヤーでより有用な情報を抽出し、完全な深度マップを強化します。さらに、深度マップの品質と構造を強化するために、境界一貫性の概念を提案します。実験結果は、Matterport3Dデータセットでの以前の最先端の深さ補完作業よりも優れた自己注意および境界一貫性スキーマの有効性を検証します。コードはhttps://github.com/patrickwu2/Depth-Completionで公開されています
Depth estimation features are helpful for 3D recognition. Commodity-grade depth cameras are able to capture depth and color image in real-time. However, glossy, transparent or distant surface cannot be scanned properly by the sensor. As a result, enhancement and restoration from sensing depth is an important task. Depth completion aims at filling the holes that sensors fail to detect, which is still a complex task for machine to learn. Traditional hand-tuned methods have reached their limits, while neural network based methods tend to copy and interpolate the output from surrounding depth values. This leads to blurred boundaries, and structures of the depth map are lost. Consequently, our main work is to design an end-to-end network improving completion depth maps while maintaining edge clarity. We utilize self-attention mechanism, previously used in image inpainting fields, to extract more useful information in each layer of convolution so that the complete depth map is enhanced. In addition, we propose boundary consistency concept to enhance the depth map quality and structure. Experimental results validate the effectiveness of our self-attention and boundary consistency schema, which outperforms previous state-of-the-art depth completion work on Matterport3D dataset. Our code is publicly available at https://github.com/patrickwu2/Depth-Completion