arXiv reaDer
視覚的な質問応答のためのオブジェクトグラフと関係グラフの共同学習
Joint learning of object graph and relation graph for visual question answering
シーングラフを介して視覚的な質問応答(VQA)をモデル化すると、推論の精度と解釈可能性を大幅に向上させることができます。ただし、既存のモデルは、属性または関係を含む複雑な推論の質問に対する回答が不十分であるため、図1(a)で誤った属性選択または関係の欠落が発生します。これらのモデルは、関係や属性情報を無視して、シーングラフのすべての種類の情報のバランスをとることができないためです。本論文では、マルチスケールシーングラフ情報を適切に符号化することによりバランスの取れた表現を得ることができる、新しいデュアルメッセージパッシング拡張グラフニューラルネットワーク(DM-GNN)を紹介します。具体的には、(i)シーングラフを、オブジェクトと関係に焦点を絞った2つのグラフに変換します。次に、それらをエンコードするための二重構造を設計します。これにより、リレーションからの重みが増加します。(ii)エンコーダ出力を属性機能と融合し、属性からの重みを増加させます。 (iii)オブジェクト、リレーション、および属性間の情報転送を強化するためのメッセージパッシングメカニズムを提案します。 GQA、VG、motif-VGを含むデータセットで広範な実験を行い、新しい最先端を実現します。
Modeling visual question answering(VQA) through scene graphs can significantly improve the reasoning accuracy and interpretability. However, existing models answer poorly for complex reasoning questions with attributes or relations, which causes false attribute selection or missing relation in Figure 1(a). It is because these models cannot balance all kinds of information in scene graphs, neglecting relation and attribute information. In this paper, we introduce a novel Dual Message-passing enhanced Graph Neural Network (DM-GNN), which can obtain a balanced representation by properly encoding multi-scale scene graph information. Specifically, we (i)transform the scene graph into two graphs with diversified focuses on objects and relations; Then we design a dual structure to encode them, which increases the weights from relations (ii)fuse the encoder output with attribute features, which increases the weights from attributes; (iii)propose a message-passing mechanism to enhance the information transfer between objects, relations and attributes. We conduct extensive experiments on datasets including GQA, VG, motif-VG and achieve new state of the art.
updated: Mon May 09 2022 11:08:43 GMT+0000 (UTC)
published: Mon May 09 2022 11:08:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト