arXiv reaDer
Tigris: Architecture and Algorithms for 3D Perception in Point Clouds
 機械認識アプリケーションは、3D点群の操作と処理にますます移行しています。このホワイトペーパーでは、オドメトリ、ローカリゼーションとマッピングの同時実行、3D再構築などの高レベルタスクで広く使用されている3Dデータ処理の主要なプリミティブであるポイントクラウド登録に焦点を当てています。これらのアプリケーションはエネルギーに制約のある環境で日常的に展開されるため、リアルタイムでエネルギー効率の高いポイントクラウド登録が重要です。 Tigris、ポイントクラウド登録に特化したアルゴリズムとアーキテクチャの共同設計システムを紹介します。登録パイプラインのデザインスペースを詳細に調査すると、デザインポイントが異なると精度とパフォーマンスのトレードオフが大きく異なりますが、KDツリー検索はパフォーマンスの一般的なボトルネックであり、アーキテクチャの専門化の理想的な候補であることがわかります。 KDツリー検索は本質的にシーケンシャルですが、ポイントクラウド登録のコンテキストでKDツリー検索のさまざまな形式の並列処理を公開するアクセラレーション対応データ構造と検索アルゴリズムを提案します。共同設計されたアクセラレータは、並列性を体系的に活用しながら、アクセラレータの効率をさらに向上させる一連のアーキテクチャ手法を取り入れています。全体的に、Tigrisは、RTX 2080 Ti GPUを介したKDツリー検索で77.2倍の高速化と7.4倍の電力削減を実現し、41.7%の登録パフォーマンスの改善と3.0倍の電力削減につながります。
Machine perception applications are increasingly moving toward manipulating and processing 3D point cloud. This paper focuses on point cloud registration, a key primitive of 3D data processing widely used in high-level tasks such as odometry, simultaneous localization and mapping, and 3D reconstruction. As these applications are routinely deployed in energy-constrained environments, real-time and energy-efficient point cloud registration is critical. We present Tigris, an algorithm-architecture co-designed system specialized for point cloud registration. Through an extensive exploration of the registration pipeline design space, we find that, while different design points make vastly different trade-offs between accuracy and performance, KD-tree search is a common performance bottleneck, and thus is an ideal candidate for architectural specialization. While KD-tree search is inherently sequential, we propose an acceleration-amenable data structure and search algorithm that exposes different forms of parallelism of KD-tree search in the context of point cloud registration. The co-designed accelerator systematically exploits the parallelism while incorporating a set of architectural techniques that further improve the accelerator efficiency. Overall, Tigris achieves 77.2× speedup and 7.4× power reduction in KD-tree search over an RTX 2080 Ti GPU, which translates to a 41.7% registration performance improvements and 3.0× power reduction.
updated: Thu Nov 21 2019 01:42:42 GMT+0000 (UTC)
published: Sat Nov 16 2019 16:54:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト