arXiv reaDer
Triangle-Net:点群学習のロバスト性に向けて
Triangle-Net: Towards Robustness in Point Cloud Learning
3次元(3D)オブジェクト認識は、自動運転車、サービスロボット、監視ドローンなどの多くのコンピュータービジョンシステムが非構造化環境でより効果的に動作するための重要な望ましい機能になりつつあります。これらのリアルタイムシステムには、さまざまなサンプリング解像度、ノイズの多い測定、および制約のないポーズ構成に対して堅牢な効果的な分類方法が必要です。以前の調査では、ポイントのスパース性、回転、および位置固有の分散により、ポイントクラウドベースの分類手法のパフォーマンスが大幅に低下する可能性があることが示されています。ただし、どちらも多因子分散と有意なスパース性に対して十分に堅牢ではありません。この点で、回転、位置シフト、スケーリングに対する不変性を同時に達成でき、点のスパース性に対してロバストである3D分類の新しいアプローチを提案します。この目的のために、点群のグラフ構造を利用する新しい機能を紹介します。これは、提案されたニューラルネットワークでエンドツーエンドで学習して、3Dオブジェクトの堅牢な潜在表現を取得できます。このような潜在表現は、ポイントがスパースである場合に、オブジェクトの分類および検索タスクのパフォーマンスを大幅に向上させることができることを示しています。さらに、任意のSO(3)回転下でわずか16ポイントのスパースポイントクラウドを使用したModelNet 40分類タスクで、私たちのアプローチがPointNetおよび3DmFVをそれぞれ35.0%および28.1%上回っていることを示します。
Three dimensional (3D) object recognition is becoming a key desired capability for many computer vision systems such as autonomous vehicles, service robots and surveillance drones to operate more effectively in unstructured environments. These real-time systems require effective classification methods that are robust to various sampling resolutions, noisy measurements, and unconstrained pose configurations. Previous research has shown that points' sparsity, rotation and positional inherent variance can lead to a significant drop in the performance of point cloud based classification techniques. However, neither of them is sufficiently robust to multifactorial variance and significant sparsity. In this regard, we propose a novel approach for 3D classification that can simultaneously achieve invariance towards rotation, positional shift, scaling, and is robust to point sparsity. To this end, we introduce a new feature that utilizes graph structure of point clouds, which can be learned end-to-end with our proposed neural network to acquire a robust latent representation of the 3D object. We show that such latent representations can significantly improve the performance of object classification and retrieval tasks when points are sparse. Further, we show that our approach outperforms PointNet and 3DmFV by 35.0% and 28.1% respectively in ModelNet 40 classification tasks using sparse point clouds of only 16 points under arbitrary SO(3) rotation.
updated: Tue Aug 24 2021 02:07:06 GMT+0000 (UTC)
published: Thu Feb 27 2020 20:42:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト