点群の登録は、3Dコンピュータービジョンの基本的な問題です。この論文では、ポイントクラウド登録を強化学習の計画問題にキャストします。強化学習では、試行錯誤によってソースポイントクラウドとターゲットポイントクラウドの間の変換を求めることができます。点群登録プロセスをマルコフ決定過程(MDP)としてモデル化することにより、変換ネットワークと評価ネットワークで構成される点群の潜在的な動的モデルを開発します。変換ネットワークは、剛体変換(つまり、アクション)を実行した後、ポイントクラウドの新しい変換された特徴を予測することを目的とし、評価ネットワークは、変換されたソースポイントクラウドとターゲットポイントクラウドの間のアライメント精度を報酬信号として予測することを目的としています。 。点群の動的モデルがトレーニングされると、クロスエントロピー法(CEM)を使用して、点群登録プロセスで報酬を最大化することにより、計画ポリシーを繰り返し更新します。したがって、最適なポリシー、つまりソースポイントクラウドとターゲットポイントクラウド間の変換は、変換の検索スペースを徐々に狭くすることで取得できます。 ModelNet40および7Sceneベンチマークデータセットの実験結果は、私たちの方法が教師なしの方法で良好な登録パフォーマンスを生み出すことができることを示しています。
Point cloud registration is a fundamental problem in 3D computer vision. In this paper, we cast point cloud registration into a planning problem in reinforcement learning, which can seek the transformation between the source and target point clouds through trial and error. By modeling the point cloud registration process as a Markov decision process (MDP), we develop a latent dynamic model of point clouds, consisting of a transformation network and evaluation network. The transformation network aims to predict the new transformed feature of the point cloud after performing a rigid transformation (i.e., action) on it while the evaluation network aims to predict the alignment precision between the transformed source point cloud and target point cloud as the reward signal. Once the dynamic model of the point cloud is trained, we employ the cross-entropy method (CEM) to iteratively update the planning policy by maximizing the rewards in the point cloud registration process. Thus, the optimal policy, i.e., the transformation between the source and target point clouds, can be obtained via gradually narrowing the search space of the transformation. Experimental results on ModelNet40 and 7Scene benchmark datasets demonstrate that our method can yield good registration performance in an unsupervised manner.