arXiv reaDer
顕著性ランキングのための双方向オブジェクトコンテキスト優先順位付け学習
Bi-directional Object-context Prioritization Learning for Saliency Ranking
顕著性ランキングタスクは、人間が顕著性の程度に基づいてシーンのさまざまなオブジェクトに注意を向ける視覚的行動を研究するために最近提案されました。既存のアプローチは、オブジェクト-オブジェクトまたはオブジェクト-シーンの関係のいずれかを学習することに焦点を当てています。このような戦略は、心理学におけるオブジェクトベースの注意の考え方に従いますが、セマンティクスが強いオブジェクト(たとえば、人間)を優先する傾向があり、非現実的な顕著性のランク付けになります。空間的注意は、人間の視覚認識システムにおけるオブジェクトベースの注意と同時に機能することを観察します。認識プロセス中に、人間の空間的注意メカニズムは、領域から領域へ(つまり、コンテキストからコンテキストへ)移動、関与、および離脱します。これは、顕著性のランク付けのために、オブジェクトレベルの推論に加えて、地域レベルの相互作用をモデル化するように促します。この目的のために、我々は、顕著性ランキングのために空間的注意とオブジェクトベースの注意を統合するための新しい双方向の方法を提案します。私たちのモデルには、2つの新しいモジュールが含まれています。(1)顕著なオブジェクトのセマンティック表現を推測することによってオブジェクトベースの注意をモデル化する選択的オブジェクト顕著性(SOS)モジュール、および(2)顕著性を割り当てるオブジェクト-コンテキスト-オブジェクト関係(OCOR)モジュール顕著なオブジェクトのオブジェクト-コンテキストおよびコンテキスト-オブジェクトの相互作用を共同でモデル化することにより、オブジェクトにランク付けします。広範な実験は、私たちのアプローチが既存の最先端の方法よりも優れていることを示しています。コードと事前トレーニング済みモデルは、https://github.com/GrassBro/OCORで入手できます。
The saliency ranking task is recently proposed to study the visual behavior that humans would typically shift their attention over different objects of a scene based on their degrees of saliency. Existing approaches focus on learning either object-object or object-scene relations. Such a strategy follows the idea of object-based attention in Psychology, but it tends to favor those objects with strong semantics (e.g., humans), resulting in unrealistic saliency ranking. We observe that spatial attention works concurrently with object-based attention in the human visual recognition system. During the recognition process, the human spatial attention mechanism would move, engage, and disengage from region to region (i.e., context to context). This inspires us to model the region-level interactions, in addition to the object-level reasoning, for saliency ranking. To this end, we propose a novel bi-directional method to unify spatial attention and object-based attention for saliency ranking. Our model includes two novel modules: (1) a selective object saliency (SOS) module that models objectbased attention via inferring the semantic representation of the salient object, and (2) an object-context-object relation (OCOR) module that allocates saliency ranks to objects by jointly modeling the object-context and context-object interactions of the salient objects. Extensive experiments show that our approach outperforms existing state-of-theart methods. Our code and pretrained model are available at https://github.com/GrassBro/OCOR.
updated: Thu Mar 17 2022 16:16:03 GMT+0000 (UTC)
published: Thu Mar 17 2022 16:16:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト