LU-Net:エンドツーエンドで学習した3D機能とU-Netに基づく3D LiDAR点群のセマンティックセグメンテーションのための効率的なネットワーク
LU-Net: An Efficient Network for 3D LiDAR Point Cloud Semantic Segmentation Based on End-to-End-Learned 3D Features and U-Net
  LU-Net-LiDAR U-Net、3D LiDAR点群のセマンティックセグメンテーションのための新しい方法を提案します。 PointNetなどのグローバルな3Dセグメンテーション手法を適用する代わりに、LiDARポイントクラウドセマンティックセグメンテーションのエンドツーエンドアーキテクチャを提案します。このアーキテクチャは、画像処理の問題として効率的に問題を解決します。最初に、3D近傍が指定された各ポイントの高レベル3Dフィーチャを抽出します。次に、これらの機能は、センサーのトポロジを考慮して、2Dマルチチャネルレンジイメージに投影されます。これらの学習機能とこの予測のおかげで、非常に効率的でありながら非常に優れたパフォーマンスを発揮する単純なU-Netセグメンテーションネットワークを使用して、最終的にセグメンテーションを実行できます。このようにして、データの3D特性とLiDARセンサーの特異性の両方を活用できます。私たちの実験が示すように、このアプローチはKITTIデータセット上で最先端をはるかに上回っています。さらに、このアプローチは単一のGPUで24 fpsで動作します。これは一般的なLiDARセンサーの取得率を上回っており、リアルタイムアプリケーションに適しています。
We propose LU-Net -- for LiDAR U-Net, a new method for the semantic segmentation of a 3D LiDAR point cloud. Instead of applying some global 3D segmentation method such as PointNet, we propose an end-to-end architecture for LiDAR point cloud semantic segmentation that efficiently solves the problem as an image processing problem. We first extract high-level 3D features for each point given its 3D neighbors. Then, these features are projected into a 2D multichannel range-image by considering the topology of the sensor. Thanks to these learned features and this projection, we can finally perform the segmentation using a simple U-Net segmentation network, which performs very well while being very efficient. In this way, we can exploit both the 3D nature of the data and the specificity of the LiDAR sensor. This approach outperforms the state-of-the-art by a large margin on the KITTI dataset, as our experiments show. Moreover, this approach operates at 24fps on a single GPU. This is above the acquisition rate of common LiDAR sensors which makes it suitable for real-time applications.
