arXiv reaDer
PanopticFusion:ものと物のレベルでのオンラインボリュームセマンティックマッピング
PanopticFusion: Online Volumetric Semantic Mapping at the Level of Stuff and Things
  ものや物のレベルでの新しいオンラインボリュームセマンティックマッピングシステムであるPanopticFusionを提案します。従来のセマンティックマッピングシステムとは対照的に、PanopticFusionは、背景領域(スタッフ)のクラスラベルを密に予測し、任意の前景オブジェクト(モノ)を個別にセグメント化できます。さらに、システムには、空間的にハッシュされたボリュームマップ表現の使用により、大規模なシーンを再構築し、ラベル付きメッシュを抽出する機能があります。私たちのシステムは、2Dセマンティックとインスタンスセグメンテーション出力を融合することにより、着信RGBフレームのピクセル単位のパノラマラベル(スタッフ領域のクラスラベルとモノ領域のインスタンスID)を最初に予測します。予測されたパノプティックラベルは、その時点で3Dマップを参照することにより、フレームごとに変化する可能性のあるインスタンスIDの一貫性を保ちながら、深度測定とともに体積マップに統合されます。さらに、マップ正則化のためのパノラマラベルに関して、完全に接続された条件付きランダムフィールド(CRF)モデルを構築します。オンラインCRF推論のために、新しい単項ポテンシャル近似とマップ分割戦略を提案します。 ScanNet(v2)データセットでのシステムのパフォーマンスを評価しました。 PanopticFusionは、セマンティックベンチマークとインスタンスセグメンテーションベンチマークの両方で、最新のオフライン3D DNNメソッドを上回るか、比較されました。また、提案されたシステムによって生成された3Dパノプティックマップを使用して、有望な拡張現実アプリケーションを示します。
We propose PanopticFusion, a novel online volumetric semantic mapping system at the level of stuff and things. In contrast to previous semantic mapping systems, PanopticFusion is able to densely predict class labels of a background region (stuff) and individually segment arbitrary foreground objects (things). In addition, our system has the capability to reconstruct a large-scale scene and extract a labeled mesh thanks to its use of a spatially hashed volumetric map representation. Our system first predicts pixel-wise panoptic labels (class labels for stuff regions and instance IDs for thing regions) for incoming RGB frames by fusing 2D semantic and instance segmentation outputs. The predicted panoptic labels are integrated into the volumetric map together with depth measurements while keeping the consistency of the instance IDs, which could vary frame to frame, by referring to the 3D map at that moment. In addition, we construct a fully connected conditional random field (CRF) model with respect to panoptic labels for map regularization. For online CRF inference, we propose a novel unary potential approximation and a map division strategy. We evaluated the performance of our system on the ScanNet (v2) dataset. PanopticFusion outperformed or compared with state-of-the-art offline 3D DNN methods in both semantic and instance segmentation benchmarks. Also, we demonstrate a promising augmented reality application using a 3D panoptic map generated by the proposed system.
updated: Mon Sep 09 2019 07:59:08 GMT+0000 (UTC)
published: Mon Mar 04 2019 11:27:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト