テクスチャメッシュとして表される3D都市シーンを解釈するための新しいディープラーニングベースのフレームワークを紹介します。オブジェクトの境界は通常、平面領域の境界と整列するという観察に基づいて、フレームワークは2つのステップでセマンティックセグメンテーションを実現します。平面性に敏感なオーバーセグメンテーションとそれに続くセマンティック分類です。オーバーセグメンテーションステップは、都市シーンの平面領域と非平面領域をキャプチャするメッシュセグメントの初期セットを生成します。次の分類ステップでは、ノード内のセグメントの幾何学的およびフォトメトリックな特徴と、そのエッジ内のマルチスケールのコンテキスト特徴をエンコードするグラフを作成します。最終的なセマンティックセグメンテーションは、グラフ畳み込みネットワークを使用してセグメントを分類することによって取得されます。 2つのセマンティックアーバンメッシュベンチマークでの実験と比較は、境界品質、平均IoU(結合に対する交差)、および一般化能力の点で、私たちのアプローチが最先端の方法よりも優れていることを示しています。また、セマンティックセグメンテーション専用のメッシュオーバーセグメンテーション手法を評価するためのいくつかの新しいメトリックを紹介します。提案されたオーバーセグメンテーションアプローチは、すべてのメトリックで最先端の手法よりも優れています。ソースコードはhttps://github.com/WeixiaoGao/PSSNetで入手できます。
We introduce a novel deep learning-based framework to interpret 3D urban scenes represented as textured meshes. Based on the observation that object boundaries typically align with the boundaries of planar regions, our framework achieves semantic segmentation in two steps: planarity-sensible over-segmentation followed by semantic classification. The over-segmentation step generates an initial set of mesh segments that capture the planar and non-planar regions of urban scenes. In the subsequent classification step, we construct a graph that encodes the geometric and photometric features of the segments in its nodes and the multi-scale contextual features in its edges. The final semantic segmentation is obtained by classifying the segments using a graph convolutional network. Experiments and comparisons on two semantic urban mesh benchmarks demonstrate that our approach outperforms the state-of-the-art methods in terms of boundary quality, mean IoU (intersection over union), and generalization ability. We also introduce several new metrics for evaluating mesh over-segmentation methods dedicated to semantic segmentation, and our proposed over-segmentation approach outperforms state-of-the-art methods on all metrics. Our source code is available at https://github.com/WeixiaoGao/PSSNet.