arXiv reaDer
CAT:ワンショットオブジェクト検出用のクロスアテンショントランスフォーマー
CAT: Cross-Attention Transformer for One-Shot Object Detection
新規クラスからのクエリパッチが与えられると、ワンショットオブジェクト検出は、意味的類似性の比較を通じて、ターゲット画像内のそのクラスのすべてのインスタンスを検出することを目的としています。ただし、新規クラスでのガイダンスが非常に限られていること、およびクエリインスタンスとターゲットインスタンスの外観の違いが見えないため、それらの意味的類似性を適切に活用して適切に一般化することは困難です。この問題を軽減するために、ワンショットオブジェクト検出における正確で効率的な意味的類似性比較のためのユニバーサルクロスアテンショントランスフォーマー(CAT)モジュールを紹介します。提案されたCATは、トランスフォーマーメカニズムを利用して、クエリからのペアのピクセルとターゲット画像の間の双方向の対応を包括的にキャプチャします。これにより、正確な類似性の比較のためにセマンティック特性を十分に活用できます。さらに、提案されたCATは、パフォーマンスを損なうことなく推論を高速化するための特徴次元圧縮を可能にします。ワンショット設定でのCOCO、VOC、およびFSODの広範な実験は、この方法の有効性と効率を示しています。たとえば、このタスクの主要なベースラインであるCoAEをCOCOのAPで1.0%超え、約2.5倍高速に実行されます。コードは将来利用可能になります。
Given a query patch from a novel class, one-shot object detection aims to detect all instances of that class in a target image through the semantic similarity comparison. However, due to the extremely limited guidance in the novel class as well as the unseen appearance difference between query and target instances, it is difficult to appropriately exploit their semantic similarity and generalize well. To mitigate this problem, we present a universal Cross-Attention Transformer (CAT) module for accurate and efficient semantic similarity comparison in one-shot object detection. The proposed CAT utilizes transformer mechanism to comprehensively capture bi-directional correspondence between any paired pixels from the query and the target image, which empowers us to sufficiently exploit their semantic characteristics for accurate similarity comparison. In addition, the proposed CAT enables feature dimensionality compression for inference speedup without performance loss. Extensive experiments on COCO, VOC, and FSOD under one-shot settings demonstrate the effectiveness and efficiency of our method, e.g., it surpasses CoAE, a major baseline in this task by 1.0% in AP on COCO and runs nearly 2.5 times faster. Code will be available in the future.
updated: Fri Apr 30 2021 13:18:53 GMT+0000 (UTC)
published: Fri Apr 30 2021 13:18:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト