特徴マッチングは、コンピューター ビジョンにおける重要な技術です。このタスクの統一された観点は、画像間の一致点を見つけるために検索空間を狭める効率的な検索戦略を目的として、検索問題として扱うことです。検索戦略の重要な側面の 1 つは検索スペースです。現在のアプローチでは検索スペースが慎重に定義されていないため、マッチング精度が制限されます。そこで、本論文では探索空間に注目し、点マッチングの初期探索空間を、顕著な意味を含む一致画像領域、名前付き意味領域一致として設定することを提案する。この検索空間は、顕著な特徴によるポイント マッチングに適しており、最近の Transformer ベースのマッチング方法の精度制限を軽減します。この検索空間を実現するために、階層的特徴マッチング フレームワークであるエリア トゥ ポイント マッチング (A2PM) を導入します。これは、最初に画像間の意味論的なエリアの一致を見つけ、その後、エリアの一致に対してポイント マッチングを実行します。さらに、このフレームワークを実現するために、セマンティック事前およびジオメトリの一貫性を利用して画像間の正確な領域一致を確立するセマンティックおよびジオメトリ領域マッチング (SGAM) 方法を提案します。 SGAM を既製の最先端のマッチャーと統合することにより、A2PM フレームワークを採用した私たちの方法は、大規模なポイント マッチングおよび姿勢推定実験の精度向上を実現します。
Feature matching is a crucial technique in computer vision. A unified perspective for this task is to treat it as a searching problem, aiming at an efficient search strategy to narrow the search space to point matches between images. One of the key aspects of search strategy is the search space, which in current approaches is not carefully defined, resulting in limited matching accuracy. This paper, thus, pays attention to the search space and proposes to set the initial search space for point matching as the matched image areas containing prominent semantic, named semantic area matches. This search space favors point matching by salient features and alleviates the accuracy limitation in recent Transformer-based matching methods. To achieve this search space, we introduce a hierarchical feature matching framework: Area to Point Matching (A2PM), to first find semantic area matches between images and later perform point matching on area matches. We further propose Semantic and Geometry Area Matching (SGAM) method to realize this framework, which utilizes semantic prior and geometry consistency to establish accurate area matches between images. By integrating SGAM with off-the-shelf state-of-the-art matchers, our method, adopting the A2PM framework, achieves encouraging precision improvements in massive point matching and pose estimation experiments.