arXiv reaDer
MT-ORL:マルチタスクオクルージョン関係学習
MT-ORL: Multi-Task Occlusion Relationship Learning
画像内の境界が希薄であるため、単一の画像内のオブジェクト間のオクルージョン関係を取得することは困難です。既存の作業で2つの重要な問題を観察します。1つは、2つのサブタスク間のデコーダー段階での限られた量の結合、つまりオクルージョン境界抽出とオクルージョン方向予測を活用できるアーキテクチャの欠如、2つ目はオクルージョン方向の不適切な表現です。この論文では、オクルージョン共有およびパス分離ネットワーク(OPNet)と呼ばれる新しいアーキテクチャを提案します。これは、共有された高レベル機能の豊富なオクルージョンキューと、タスク固有の低レベル機能の構造化された空間情報を活用することにより、最初の問題を解決します。 。次に、2番目の問題に取り組むために、シンプルで効果的な直交オクルージョン表現(OOR)を設計します。私たちの方法は、標準のPIOD / BSDS所有権データセットで6.1%/ 8.3%Boundary-APおよび6.5%/ 10%Orientation-APで最先端の方法を上回っています。コードはhttps://github.com/fengpanhe/MT-ORLで入手できます。
Retrieving occlusion relation among objects in a single image is challenging due to sparsity of boundaries in image. We observe two key issues in existing works: firstly, lack of an architecture which can exploit the limited amount of coupling in the decoder stage between the two subtasks, namely occlusion boundary extraction and occlusion orientation prediction, and secondly, improper representation of occlusion orientation. In this paper, we propose a novel architecture called Occlusion-shared and Path-separated Network (OPNet), which solves the first issue by exploiting rich occlusion cues in shared high-level features and structured spatial information in task-specific low-level features. We then design a simple but effective orthogonal occlusion representation (OOR) to tackle the second issue. Our method surpasses the state-of-the-art methods by 6.1%/8.3% Boundary-AP and 6.5%/10% Orientation-AP on standard PIOD/BSDS ownership datasets. Code is available at https://github.com/fengpanhe/MT-ORL.
updated: Wed Aug 18 2021 04:53:17 GMT+0000 (UTC)
published: Thu Aug 12 2021 13:06:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト