arXiv reaDer
CATs ++:畳み込みとトランスフォーマーによるコスト集約の強化
CATs++: Boosting Cost Aggregation with Convolutions and Transformers
コストの集計は、ノイズの多いマッチングスコアを明確にすることを目的とした、画像マッチングタスクで非常に重要なプロセスです。既存の方法は、一般に、手作りまたはCNNベースの方法でこれに取り組みます。これらの方法は、激しい変形に対するロバスト性に欠けるか、受容野が制限されて適応できないために誤った一致を識別できないCNNの制限を継承します。この論文では、自己注意メカニズムのグローバルな受容野を十分に楽しむことを可能にするいくつかのアーキテクチャ設計の助けを借りて、初期相関マップ間のグローバルなコンセンサスを調査することによってこれに取り組むために、トランスフォーマー(CAT)を使用したコスト集計を紹介します。また、CATが直面する可能性のある制限の一部を緩和するために、つまり、標準の変圧器の使用によって引き起こされる高い計算コストにより、空間および機能の次元のサイズとともに複雑さが増し、限られた解像度でのみ適用が制限され、結果としてパフォーマンスがかなり制限されているため、CATの拡張であるCATs ++を提案します。私たちが提案する方法は、以前の最先端の方法を大幅に上回り、PF-WILLOW、PF-PASCAL、SPair-71kを含むすべてのベンチマークに新しい最先端の方法を設定します。さらに、広範なアブレーション研究と分析を提供します。
Cost aggregation is a highly important process in image matching tasks, which aims to disambiguate the noisy matching scores. Existing methods generally tackle this by hand-crafted or CNN-based methods, which either lack robustness to severe deformations or inherit the limitation of CNNs that fail to discriminate incorrect matches due to limited receptive fields and inadaptability. In this paper, we introduce Cost Aggregation with Transformers (CATs) to tackle this by exploring global consensus among initial correlation map with the help of some architectural designs that allow us to fully enjoy global receptive fields of self-attention mechanism. Also, to alleviate some of the limitations that CATs may face, i.e., high computational costs induced by the use of a standard transformer that its complexity grows with the size of spatial and feature dimensions, which restrict its applicability only at limited resolution and result in rather limited performance, we propose CATs++, an extension of CATs. Our proposed methods outperform the previous state-of-the-art methods by large margins, setting a new state-of-the-art for all the benchmarks, including PF-WILLOW, PF-PASCAL, and SPair-71k. We further provide extensive ablation studies and analyses.
updated: Sun Oct 30 2022 14:40:46 GMT+0000 (UTC)
published: Mon Feb 14 2022 15:54:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト