幾何学的な3Dシーンの分類は非常に難しいタスクです。現在の方法では、RGB-Dセンサーが提供する深度チャネルのみを使用して幾何情報を抽出します。この種の方法論では、深度チャネルのローカルジオメトリコンテキストが欠落しているため、エラーが発生する可能性があります。この作品では、ポイントフィーチャを一切使用せずに3D空間内の固有の幾何学的コンテキストを活用し、組織化または非組織化3Dデータの使用を可能にする、新しい残留アテンショングラフ畳み込みネットワークを提案します。 NYU Depth v1およびSUN-RGBDデータセットで実験を行い、さまざまな構成を調査し、提案された方法の有効性を実証します。実験結果は、提案された方法が、幾何学的3Dシーン分類タスクにおいて現在の最先端技術より優れていることを示しています。
Geometric 3D scene classification is a very challenging task. Current methodologies extract the geometric information using only a depth channel provided by an RGB-D sensor. These kinds of methodologies introduce possible errors due to missing local geometric context in the depth channel. This work proposes a novel Residual Attention Graph Convolutional Network that exploits the intrinsic geometric context inside a 3D space without using any kind of point features, allowing the use of organized or unorganized 3D data. Experiments are done in NYU Depth v1 and SUN-RGBD datasets to study the different configurations and to demonstrate the effectiveness of the proposed method. Experimental results show that the proposed method outperforms current state-of-the-art in geometric 3D scene classification tasks.