Progressive Fusion for Unsupervised Binocular Depth Estimation using Cycled Networks
  教師あり回帰に基づく最近の深部単眼深度推定アプローチは、顕著なパフォーマンスを達成しています。ただし、トレーニング中にコストのかかるグラウンドトゥルースアノテーションが必要です。この問題に対処するために、本論文では、深度マップを予測するための新しい教師なしの深層学習アプローチを提示します。 Progressive Fusion Network(PFN)という名前の新しいネットワークアーキテクチャを紹介します。これは、両眼ステレオ深度推定用に特別に設計されています。このネットワークは、両方のステレオビューから提供される情報を組み合わせたマルチスケールリファインメント戦略に基づいています。さらに、サイクルを形成するために、このネットワークを2回スタックすることを提案します。このサイクルアプローチは、トレーニング時にネットワークがトレーニングセットイメージ(前方ハーフサイクル)からと合成イメージ(後方ハーフサイクル)の両方から学習するため、データ拡張の形式として解釈できます。 。アーキテクチャは、敵対的学習と共同でトレーニングされます。公開されているデータセットKITTI、Cityscapes、およびApolloScapeの広範な実験により、深度予測のための他の教師なし深層学習法と競合する提案モデルの有効性が実証されています。
Recent deep monocular depth estimation approaches based on supervised regression have achieved remarkable performance. However, they require costly ground truth annotations during training. To cope with this issue, in this paper we present a novel unsupervised deep learning approach for predicting depth maps. We introduce a new network architecture, named Progressive Fusion Network (PFN), that is specifically designed for binocular stereo depth estimation. This network is based on a multi-scale refinement strategy that combines the information provided by both stereo views. In addition, we propose to stack twice this network in order to form a cycle. This cycle approach can be interpreted as a form of data-augmentation since, at training time, the network learns both from the training set images (in the forward half-cycle) but also from the synthesized images (in the backward half-cycle). The architecture is jointly trained with adversarial learning. Extensive experiments on the publicly available datasets KITTI, Cityscapes and ApolloScape demonstrate the effectiveness of the proposed model which is competitive with other unsupervised deep learning methods for depth prediction.
updated: Tue Sep 17 2019 09:21:02 GMT+0000 (UTC)
published: Tue Sep 17 2019 09:21:02 GMT+0000 (UTC)
