arXiv reaDer
類似性を考慮した機能強化による少数ショット オブジェクトのカウント
Few-shot Object Counting with Similarity-Aware Feature Enhancement
この作業は、クエリ イメージで発生する模範オブジェクト (つまり、1 つまたは複数のサポート イメージによって記述される) の数をカウントする少数ショット オブジェクト カウントの問題を研究します。主な課題は、ターゲット オブジェクトがクエリ イメージに密集している可能性があり、すべてを認識するのが困難になることです。この障害に取り組むために、類似性比較モジュールと機能強化モジュールを備えた新しい学習ブロックを提案します。具体的には、サポート画像とクエリ画像が与えられた場合、まず空間位置ごとに投影された特徴を比較してスコア マップを導出します。すべてのサポート画像に関するスコア マップがまとめて収集され、模範次元と空間次元の両方にわたって正規化され、信頼できる類似性マップが生成されます。次に、開発されたポイントごとの類似性を重み係数として使用することにより、クエリ機能をサポート機能で強化します。このような設計により、サポート画像に似た領域により焦点を当てることで、モデルがクエリ画像を検査するようになり、異なるオブジェクト間の境界がより明確になります。さまざまなベンチマークとトレーニング設定に関する広範な実験は、最先端の方法を十分に大きく上回っていることを示唆しています。たとえば、最近の大規模な FSC-147 データセットでは、平均絶対誤差を 22.08 から 14.32 (35%\uparrow) に改善することで、最先端の方法を上回っています。コードは https://github.com/zhiyuanyou/SAFECount で公開されています。
This work studies the problem of few-shot object counting, which counts the number of exemplar objects (i.e., described by one or several support images) occurring in the query image. The major challenge lies in that the target objects can be densely packed in the query image, making it hard to recognize every single one. To tackle the obstacle, we propose a novel learning block, equipped with a similarity comparison module and a feature enhancement module. Concretely, given a support image and a query image, we first derive a score map by comparing their projected features at every spatial position. The score maps regarding all support images are collected together and normalized across both the exemplar dimension and the spatial dimensions, producing a reliable similarity map. We then enhance the query feature with the support features by employing the developed point-wise similarities as the weighting coefficients. Such a design encourages the model to inspect the query image by focusing more on the regions akin to the support images, leading to much clearer boundaries between different objects. Extensive experiments on various benchmarks and training setups suggest that we surpass the state-of-the-art methods by a sufficiently large margin. For instance, on a recent large-scale FSC-147 dataset, we surpass the state-of-the-art method by improving the mean absolute error from 22.08 to 14.32 (35%\uparrow). Code has been released in https://github.com/zhiyuanyou/SAFECount.
updated: Sun Sep 11 2022 01:49:36 GMT+0000 (UTC)
published: Sat Jan 22 2022 03:27:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト