arXiv reaDer
点群ベースの 3D シーン グラフ生成のための Transformer の再検討
Revisiting Transformer for Point Cloud-based 3D Scene Graph Generation
この論文では、3D シーン グラフ生成のためのセマンティック グラフ トランスフォーマー (SGT) を提案します。このタスクは、複雑なグローバル構造をモデル化するという中心的な課題とともに、雲点ベースのシーンをセマンティック構造グラフに解析することを目的としています。グラフ畳み込みネットワーク (GCN) に基づく既存の方法は、過剰な平滑化のジレンマに悩まされ、限定された隣接ノードからの情報しか伝播できませんでした。対照的に、当社の SGT は Transformer レイヤーをベース ビルディング ブロックとして使用し、3D シーン グラフ生成タスク用に調整された 2 種類の提案された Transformer レイヤーを使用して、グローバルな情報の受け渡しを可能にします。具体的には、同等の計算コストを維持しながら、グラフエッジのグローバル情報を最大限に活用するために、グラフ埋め込みレイヤーを導入します。さらに、セマンティック インジェクション レイヤーを提案して、カテゴリ テキスト ラベルとビジュアル オブジェクトの知識を活用します。確立された 3DSSG ベンチマークで SGT をベンチマークし、関係予測の R@50 で 35.9% の絶対改善を達成し、最先端の複雑なシーンを含むサブセットで 80.4% のブーストを達成しました。私たちの分析は、ロングテールシナリオとゼロショットシナリオでの SGT の優位性をさらに示しています。コードとモデルを公開します。
In this paper, we propose the semantic graph Transformer (SGT) for 3D scene graph generation. The task aims to parse a cloud point-based scene into a semantic structural graph, with the core challenge of modeling the complex global structure. Existing methods based on graph convolutional networks (GCNs) suffer from the over-smoothing dilemma and could only propagate information from limited neighboring nodes. In contrast, our SGT uses Transformer layers as the base building block to allow global information passing, with two types of proposed Transformer layers tailored for the 3D scene graph generation task. Specifically, we introduce the graph embedding layer to best utilize the global information in graph edges while maintaining comparable computation costs. Additionally, we propose the semantic injection layer to leverage categorical text labels and visual object knowledge. We benchmark our SGT on the established 3DSSG benchmark and achieve a 35.9% absolute improvement in relationship prediction's R@50 and an 80.4% boost on the subset with complex scenes over the state-of-the-art. Our analyses further show SGT's superiority in the long-tailed and zero-shot scenarios. We will release the code and model.
updated: Thu Mar 23 2023 06:21:43 GMT+0000 (UTC)
published: Mon Mar 20 2023 11:59:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト