arXiv reaDer
すべての関係が等しいわけではありません:シーングラフ生成のための有益なラベルのマイニング
Not All Relations are Equal: Mining Informative Labels for Scene Graph Generation
シーングラフ生成(SGG)は、オブジェクトのペア間のさまざまな相互作用をキャプチャすることを目的としています。これは、シーンを完全に理解するために不可欠です。関係のセット全体でトレーニングされた既存のSGGメソッドは、トレーニングデータのさまざまなバイアスのために、視覚的およびテキストの相関関係に関する複雑な推論を取得できません。 「parkedon」などの有益な関係ではなく「on」などの一般的な空間構成を示す自明な関係について学習しても、この複雑な推論は強制されず、一般化に悪影響を及ぼします。この問題に対処するために、情報量に基づいて関係ラベルを活用するSGGトレーニングの新しいフレームワークを提案します。モデルにとらわれないトレーニング手順では、トレーニングデータ内の情報量の少ないサンプルについて、欠落している情報量の関係を推定し、既存の注釈とともに、入力されたラベルでSGGモデルをトレーニングします。このアプローチは、最先端のSGGメソッドと組み合わせて正常に使用でき、標準のVisualGenomeベンチマークの複数のメトリックでパフォーマンスが大幅に向上することを示しています。さらに、より挑戦的なゼロショット設定で、目に見えないトリプレットの大幅な改善が得られます。
Scene graph generation (SGG) aims to capture a wide variety of interactions between pairs of objects, which is essential for full scene understanding. Existing SGG methods trained on the entire set of relations fail to acquire complex reasoning about visual and textual correlations due to various biases in training data. Learning on trivial relations that indicate generic spatial configuration like 'on' instead of informative relations such as 'parked on' does not enforce this complex reasoning, harming generalization. To address this problem, we propose a novel framework for SGG training that exploits relation labels based on their informativeness. Our model-agnostic training procedure imputes missing informative relations for less informative samples in the training data and trains a SGG model on the imputed labels along with existing annotations. We show that this approach can successfully be used in conjunction with state-of-the-art SGG methods and improves their performance significantly in multiple metrics on the standard Visual Genome benchmark. Furthermore, we obtain considerable improvements for unseen triplets in a more challenging zero-shot setting.
updated: Fri Nov 26 2021 14:34:12 GMT+0000 (UTC)
published: Fri Nov 26 2021 14:34:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト