人物検索では、あるシーンから別のギャラリー シーンのクエリ人物をローカライズすることを目指しています。この検索操作のコストは、ギャラリー シーンの数に依存するため、可能性のあるシーンのプールを減らすことが有益です。ギャラリー フィルター ネットワーク (GFN) について説明し、デモンストレーションします。これは、検索プロセスからギャラリー シーンを効率的に破棄し、残りのシーンで検出された人物のスコアリングに役立つ新しいモジュールです。クロスカメラ、遮蔽、低解像度のシナリオなど、さまざまな検索セットでテストすることにより、さまざまな条件下で GFN が堅牢であることを示します。さらに、元の SeqNet モデルを改善および簡素化する基本 SeqNeXt 人物検索モデルを開発します。 SeqNeXt + GFN の組み合わせは、標準的な PRW および CUHK-SYSU 人物検索データセットで、他の最先端の方法よりも大幅なパフォーマンスの向上をもたらすことを示しています。このモデルや他のモデルの実験を支援するために、個人検索研究に通常使用されるデータ処理および評価パイプライン用の標準化されたツールを提供します。
In person search, we aim to localize a query person from one scene in other gallery scenes. The cost of this search operation is dependent on the number of gallery scenes, making it beneficial to reduce the pool of likely scenes. We describe and demonstrate the Gallery Filter Network (GFN), a novel module which can efficiently discard gallery scenes from the search process, and benefit scoring for persons detected in remaining scenes. We show that the GFN is robust under a range of different conditions by testing on different retrieval sets, including cross-camera, occluded, and low-resolution scenarios. In addition, we develop the base SeqNeXt person search model, which improves and simplifies the original SeqNet model. We show that the SeqNeXt+GFN combination yields significant performance gains over other state-of-the-art methods on the standard PRW and CUHK-SYSU person search datasets. To aid experimentation for this and other models, we provide standardized tooling for the data processing and evaluation pipeline typically used for person search research.