環境のセマンティック特性を理解することは、自律ロボット操作を実現する重要な要素です。本論文では、LiDARスキャンをクラス車、歩行者、または自転車にセマンティックセグメンテーションするためのディープコンボリューショナルニューラルネットワーク(DCNN)を提案します。このアーキテクチャは、高密度ブロックに基づいており、深度分離可能な畳み込みを効率的に利用して、最先端のパフォーマンスを維持しながらパラメーターの数を制限します。 DCNNからの予測を時間的に一貫させるために、ベイズフィルターベースの方法を提案します。この方法は、ニューラルネットワークからの予測を使用して、スキャン内のポイントの現在の意味状態を再帰的に推定します。この再帰的推定では、以前のスキャンから得られた知識を使用するため、予測は時間的に一貫しており、孤立した誤った予測に対して堅牢です。提案されたアーキテクチャのパフォーマンスを他の最先端のニューラルネットワークアーキテクチャと比較し、大幅な改善を報告します。提案されたベイズフィルターアプローチの場合、KITTI追跡ベンチマークでさまざまなシーケンスの結果を示します。
Understanding the semantic characteristics of the environment is a key enabler for autonomous robot operation. In this paper, we propose a deep convolutional neural network (DCNN) for the semantic segmentation of a LiDAR scan into the classes car, pedestrian or bicyclist. This architecture is based on dense blocks and efficiently utilizes depth separable convolutions to limit the number of parameters while still maintaining state-of-the-art performance. To make the predictions from the DCNN temporally consistent, we propose a Bayes filter based method. This method uses the predictions from the neural network to recursively estimate the current semantic state of a point in a scan. This recursive estimation uses the knowledge gained from previous scans, thereby making the predictions temporally consistent and robust towards isolated erroneous predictions. We compare the performance of our proposed architecture with other state-of-the-art neural network architectures and report substantial improvement. For the proposed Bayes filter approach, we show results on various sequences in the KITTI tracking benchmark.