PointNetは最近、非構造化ポイントクラウドデータの一般的な表現として登場し、オブジェクト検出、セグメンテーション、形状補完などのタスクにディープラーニングを適用できるようになりました。ただし、最近の文献の研究では、PointNet表現が不整合を引き起こす感度が示されています。このホワイトペーパーでは、PointNet表現を使用して点群を整列し、追跡、3D再構成、姿勢推定などのアプリケーションの登録を実行する新しいフレームワークを紹介します。テンプレートとソースポイントクラウドのPointNet機能を比較して、それらを正確に調整する変換を見つけるフレームワークを開発します。点群によって形成されたオブジェクトの形状に関する事前情報に応じて、フレームワークは、見えない形状に対して形状固有または一般的なアプローチを作成できます。形状固有のアプローチは、完全に接続された(FC)レイヤーを備えたシャムアーキテクチャを使用し、ノイズおよびデータの初期の不整合に対して堅牢です。広範なシミュレーションと実際の実験を実行して、アプローチの有効性を検証し、パフォーマンスを最先端のアプローチと比較します。
PointNet has recently emerged as a popular representation for unstructured point cloud data, allowing application of deep learning to tasks such as object detection, segmentation and shape completion. However, recent works in literature have shown the sensitivity of the PointNet representation to pose misalignment. This paper presents a novel framework that uses the PointNet representation to align point clouds and perform registration for applications such as tracking, 3D reconstruction and pose estimation. We develop a framework that compares PointNet features of template and source point clouds to find the transformation that aligns them accurately. Depending on the prior information about the shape of the object formed by the point clouds, our framework can produce approaches that are shape specific or general to unseen shapes. The shape specific approach uses a Siamese architecture with fully connected (FC) layers and is robust to noise and initial misalignment in data. We perform extensive simulation and real-world experiments to validate the efficacy of our approach and compare the performance with state-of-art approaches.