arXiv reaDer
マルチラベル画像認識のためのトランスフォーマーベースの二重関係グラフ
Transformer-based Dual Relation Graph for Multi-label Image Recognition
1つの画像内の複数のオブジェクトの同時認識は、さまざまなオブジェクトスケール、一貫性のない外観、混乱したクラス間の関係など、認識フィールドの複数のイベントにまたがる困難な作業のままです。最近の研究努力は、主に、不明確なセマンティクスを強化するために、統計ラベルの共起と言語の単語の埋め込みに頼っています。これらの研究とは異なり、この論文では、相関の2つの側面、つまり構造関係グラフと意味関係グラフを調査することによって補完的な関係を構築する、新しいTransformerベースの二重関係学習フレームワークを提案します。構造関係グラフは、クロススケールのトランスベースのアーキテクチャを開発することにより、オブジェクトのコンテキストから長距離の相関関係をキャプチャすることを目的としています。セマンティックグラフは、明示的なセマンティック認識制約を使用して、画像オブジェクトのセマンティック意味を動的にモデル化します。さらに、学習した構造関係をセマンティックグラフに組み込み、堅牢な表現のための結合関係グラフを構築します。これらの2つの効果的な関係グラフの共学習により、私たちのアプローチは、2つの人気のあるマルチラベル認識ベンチマーク、つまりMS-COCOとVOC2007データセットで新しい最先端を実現します。
The simultaneous recognition of multiple objects in one image remains a challenging task, spanning multiple events in the recognition field such as various object scales, inconsistent appearances, and confused inter-class relationships. Recent research efforts mainly resort to the statistic label co-occurrences and linguistic word embedding to enhance the unclear semantics. Different from these researches, in this paper, we propose a novel Transformer-based Dual Relation learning framework, constructing complementary relationships by exploring two aspects of correlation,~i.e. , structural relation graph and semantic relation graph. The structural relation graph aims to capture long-range correlations from object context, by developing a cross-scale transformer-based architecture. The semantic graph dynamically models the semantic meanings of image objects with explicit semantic-aware constraints. In addition, we also incorporate the learnt structural relationship into the semantic graph, constructing a joint relation graph for robust representations. With the collaborative learning of these two effective relation graphs, our approach achieves new state-of-the-art on two popular multi-label recognition benchmarks, i.e., MS-COCO and VOC 2007 dataset.
updated: Sun Oct 10 2021 07:14:52 GMT+0000 (UTC)
published: Sun Oct 10 2021 07:14:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト