arXiv reaDer
開集合と閉集合の設定での視覚探索への対応
Addressing Visual Search in Open and Closed Set Settings
大きな画像で小さなオブジェクトを検索することは、現在の深層学習システムにとって困難であると同時に、リモートセンシングや医用画像などの多くの実際のアプリケーションでも重要なタスクです。非常に大きな画像を完全にスキャンすると、特に小さなオブジェクトをキャプチャするのに十分な解像度では、計算コストが高くなります。関心のあるオブジェクトが小さいほど、雑然として隠されたり、重要でないと見なされたりする可能性が高くなります。これらの問題を、閉集合オブジェクト検出と開集合ターゲット検索という2つの補完的な問題のコンテキストで調べます。最初に、低解像度の要点画像からピクセルレベルのオブジェクト性を予測する方法を示します。次に、これを使用して、高解像度でローカルにオブジェクト検出を実行する領域を選択します。このアプローチには、事前に定義されたグリッドに固定されないという利点があります。これにより、既存の方法よりもコストのかかる高解像度の垣間見ることが少なくて済みます。次に、以前は見えなかった可能性があり、単一の画像によって定義されたターゲットクラスのすべてのインスタンスを見つけようとする、オープンセットの視覚探索のための新しい戦略を提案します。確率論的ベイズレンズを介して両方の検出問題を解釈します。これにより、この方法で生成されたオブジェクトネスマップは、検出ステップへの最大事後アプローチの事前確率として機能します。パッチ選択戦略とこのターゲット検索アプローチの組み合わせ、およびパッチ選択戦略と標準のオブジェクト検出方法の組み合わせの両方のエンドツーエンドのパフォーマンスを評価します。私たちのアプローチの両方の要素は、ベースライン戦略を大幅に上回っています。
Searching for small objects in large images is a task that is both challenging for current deep learning systems and important in numerous real-world applications, such as remote sensing and medical imaging. Thorough scanning of very large images is computationally expensive, particularly at resolutions sufficient to capture small objects. The smaller an object of interest, the more likely it is to be obscured by clutter or otherwise deemed insignificant. We examine these issues in the context of two complementary problems: closed-set object detection and open-set target search. First, we present a method for predicting pixel-level objectness from a low resolution gist image, which we then use to select regions for performing object detection locally at high resolution. This approach has the benefit of not being fixed to a predetermined grid, thereby requiring fewer costly high-resolution glimpses than existing methods. Second, we propose a novel strategy for open-set visual search that seeks to find all instances of a target class which may be previously unseen and is defined by a single image. We interpret both detection problems through a probabilistic, Bayesian lens, whereby the objectness maps produced by our method serve as priors in a maximum-a-posteriori approach to the detection step. We evaluate the end-to-end performance of both the combination of our patch selection strategy with this target search approach and the combination of our patch selection strategy with standard object detection methods. Both elements of our approach are seen to significantly outperform baseline strategies.
updated: Wed Apr 14 2021 21:43:19 GMT+0000 (UTC)
published: Fri Dec 11 2020 17:21:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト