arXiv reaDer
階層関係推論からのシーングラフ生成
Scene Graph Generation from Hierarchical Relationship Reasoning
この論文では、視覚的なシーン内のオブジェクト間の関係を推測するための新しいアプローチを紹介します。これは、オブジェクトと関係のカテゴリを互いに素なスーパー カテゴリに分割するために適用できる有益な階層構造を明示的に利用します。具体的には、私たちの提案手法にはベイズ予測ヘッドが組み込まれており、2 つのオブジェクト間の関係のタイプとしてのスーパーカテゴリーと、そのスーパーカテゴリー内の詳細な関係の共同予測が可能になります。この設計により、クラスの不均衡の問題の影響が軽減されます。さらに、階層分類スキームを適応させるために教師あり対照学習も変更します。 Visual Genome および OpenImage V6 データセットの実験評価では、この因数分解アプローチにより、特に述語分類とゼロショット タスクにおいて、比較的単純なモデルが競争力のあるパフォーマンスを達成できることが実証されました。
This paper presents a novel approach for inferring relationships between objects in visual scenes. It explicitly exploits an informative hierarchical structure that can be imposed to divide the object and relationship categories into disjoint super-categories. Specifically, our proposed method incorporates a Bayes prediction head, enabling joint predictions of the super-category as the type of relationship between the two objects, along with the detailed relationship within that super-category. This design reduces the impact of class imbalance problems. Furthermore, we also modify the supervised contrastive learning to adapt our hierarchical classification scheme. Experimental evaluations on the Visual Genome and OpenImage V6 datasets demonstrate that this factorized approach allows a relatively simple model to achieve competitive performance, particularly in predicate classification and zero-shot tasks.
updated: Wed Jul 26 2023 03:53:19 GMT+0000 (UTC)
published: Mon Mar 13 2023 04:16:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト