arXiv reaDer
半教師ありディープマルチビューステレオ
Semi-supervised Deep Multi-view Stereo
教師ありおよび教師なし設定の学習ベースのマルチビューステレオ(MVS)で、大きな進歩が見られました。精度と完全性のそれぞれのメリットを組み合わせ、同時に高価なラベル付きデータの需要を減らすために、このペーパーでは、MVSデータのごく一部のみが密な深さのグラウンドトゥルースに関連付けられている学習ベースのMVS問題の新しい半教師あり設定について説明します。 。ただし、シナリオのバリエーションが非常に多く、ビューの設定が柔軟であるため、半教師ありMVS問題(Semi-MVS)は、ラベルなしデータとラベル付きデータが同じラベル空間とデータ分布を共有するという、従来の半教師あり学習の基本的な仮定を破る可能性があります。 。これらの問題を処理するために、新しい半教師ありMVSフレームワーク、つまりSE-MVSを提案します。基本的な仮定がMVSデータで機能するという単純なケースの場合、整合性の正則化により、モデル予測が元のサンプルとランダムに拡張されたサンプルの間でKL発散の制約を介して整合するようになります。 MVSデータで基本的な仮定が矛盾するというさらに厄介なケースについては、分布ギャップによって引き起こされる悪影響を軽減するために、新しいスタイルの一貫性の損失を提案します。ラベルのないサンプルの視覚スタイルは、ギャップを縮小するためにラベルの付いたサンプルに転送され、生成されたサンプルのモデル予測は、元のラベルの付いたサンプルのラベルでさらに監視されます。 DTU、BlendedMVS、GTA-SFM、およびTanks \&Templesデータセットの実験結果は、提案された方法の優れたパフォーマンスを示しています。バックボーンネットワークで同じ設定を使用すると、提案されたSE-MVSは、完全に監視されたベースラインと監視されていないベースラインを上回ります。
Significant progress has been witnessed in learning-based Multi-view Stereo (MVS) of supervised and unsupervised settings. To combine their respective merits in accuracy and completeness, meantime reducing the demand for expensive labeled data, this paper explores a novel semi-supervised setting of learning-based MVS problem that only a tiny part of the MVS data is attached with dense depth ground truth. However, due to huge variation of scenarios and flexible setting in views, semi-supervised MVS problem (Semi-MVS) may break the basic assumption in classic semi-supervised learning, that unlabeled data and labeled data share the same label space and data distribution. To handle these issues, we propose a novel semi-supervised MVS framework, namely SE-MVS. For the simple case that the basic assumption works in MVS data, consistency regularization encourages the model predictions to be consistent between original sample and randomly augmented sample via constraints on KL divergence. For further troublesome case that the basic assumption is conflicted in MVS data, we propose a novel style consistency loss to alleviate the negative effect caused by the distribution gap. The visual style of unlabeled sample is transferred to labeled sample to shrink the gap, and the model prediction of generated sample is further supervised with the label in original labeled sample. The experimental results on DTU, BlendedMVS, GTA-SFM, and Tanks\&Temples datasets show the superior performance of the proposed method. With the same settings in backbone network, our proposed SE-MVS outperforms its fully-supervised and unsupervised baselines.
updated: Sun Jul 24 2022 09:37:42 GMT+0000 (UTC)
published: Sun Jul 24 2022 09:37:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト