人気のある幾何学的表現として、点群は3Dビジョンで大きな注目を集めており、自動運転やロボット工学で多くのアプリケーションにつながっています。点群で学習するための重要であるが未解決の問題の1つは、同じオブジェクトの点群が、異なる手順を使用して生成された場合、または異なるセンサーを使用してキャプチャされた場合、大きな幾何学的変化をもたらす可能性があることです。これらの不整合は、あるドメインでトレーニングされたニューラルネットワークが他のドメインで一般化できない可能性があるようなドメインギャップを引き起こします。ドメインギャップを減らすための一般的な手法は、敵対的なトレーニングを実行して、フィーチャスペースの点群を整列させることです。ただし、敵対的な訓練は、縮退した極小値に陥りやすく、その結果、適応がマイナスになります。ここでは、1回のショットで2つの重要な役割を果たす、ジオメトリ認識暗黙を学習する自己監視タスクを採用することにより、点群での教師なしドメイン適応のためのシンプルで効果的な方法を提案します。まず、点群の幾何学的情報は、ダウンストリームタスクの暗黙的な表現を通じて保持されます。さらに重要なことに、ドメイン固有のバリエーションは、暗黙の空間で効果的に学習できます。また、実際には形状モデルがないため、任意の点群の符号なし距離フィールドを計算するための適応戦略を提案します。タスクの損失と組み合わせると、提案されたものは、敵対的なドメインアラインメントとより複雑な自己監視タスクに依存する最先端の教師なしドメイン適応方法よりも優れています。私たちの方法は、PointDA-10とGraspNetの両方のデータセットで評価されます。コードとトレーニング済みモデルは公開されます。
As a popular geometric representation, point clouds have attracted much attention in 3D vision, leading to many applications in autonomous driving and robotics. One important yet unsolved issue for learning on point cloud is that point clouds of the same object can have significant geometric variations if generated using different procedures or captured using different sensors. These inconsistencies induce domain gaps such that neural networks trained on one domain may fail to generalize on others. A typical technique to reduce the domain gap is to perform adversarial training so that point clouds in the feature space can align. However, adversarial training is easy to fall into degenerated local minima, resulting in negative adaptation gains. Here we propose a simple yet effective method for unsupervised domain adaptation on point clouds by employing a self-supervised task of learning geometry-aware implicits, which plays two critical roles in one shot. First, the geometric information in the point clouds is preserved through the implicit representations for downstream tasks. More importantly, the domain-specific variations can be effectively learned away in the implicit space. We also propose an adaptive strategy to compute unsigned distance fields for arbitrary point clouds due to the lack of shape models in practice. When combined with a task loss, the proposed outperforms state-of-the-art unsupervised domain adaptation methods that rely on adversarial domain alignment and more complicated self-supervised tasks. Our method is evaluated on both PointDA-10 and GraspNet datasets. The code and trained models will be publicly available.