Operator-in-the-Loop Deep Sequential Multi-camera Feature Fusion for Person Re-identification
 クエリとしてターゲット画像が与えられると、人物再識別システムはカメラごとにランク付けされた候補一致リストを取得します。展開されたシステムでは、人間のオペレーターがこれらのリストをスキャンし、タッチまたはマウスベースの選択により、視力のあるターゲットにラベルを付けます。ただし、従来のre-idアプローチでは、カメラごとのリストが個別に生成されます。したがって、カメラのサブセット内のオペレータによるターゲットの識別を利用して、ネットワークカメラの残りのセット内のターゲットのランキングを改善することはできません。この欠点に対処するために、新しいシーケンシャルマルチカメラre-idアプローチを提案します。提案されたアプローチは、人間のオペレータの入力に対応でき、ターゲットのランキングの単調な改善により早期の利益を提供します。アプローチの中心にあるのは、クエリと候補の一致の深い特徴表現で動作する融合関数です。クエリ表現を段階的に改善するためにカスタム設計された最適化手順を策定します。既存の評価方法を設定に直接採用することはできないため、2つの新しい評価プロトコルも提案します。 2つの大規模なre-idデータセット(Market-1501、DukeMTMC-reID)の結果は、マルチカメラ方式がベースラインやその他の一般的な機能融合スキームを大幅に上回ることを示しています。さらに、人間のオペレータのパフォーマンスに関するサブジェクトベースの比較研究を実施します。当社のアプローチによって実現された優れたオペレーターのパフォーマンスは、展開可能なビデオ監視システムへの統合の魅力的なケースになります。
Given a target image as query, person re-identification systems retrieve a ranked list of candidate matches on a per-camera basis. In deployed systems, a human operator scans these lists and labels sighted targets by touch or mouse-based selection. However, classical re-id approaches generate per-camera lists independently. Therefore, target identifications by operator in a subset of cameras cannot be utilized to improve ranking of the target in remaining set of network cameras. To address this shortcoming, we propose a novel sequential multi-camera re-id approach. The proposed approach can accommodate human operator inputs and provides early gains via a monotonic improvement in target ranking. At the heart of our approach is a fusion function which operates on deep feature representations of query and candidate matches. We formulate an optimization procedure custom-designed to incrementally improve query representation. Since existing evaluation methods cannot be directly adopted to our setting, we also propose two novel evaluation protocols. The results on two large-scale re-id datasets (Market-1501, DukeMTMC-reID) demonstrate that our multi-camera method significantly outperforms baselines and other popular feature fusion schemes. Additionally, we conduct a comparative subject-based study of human operator performance. The superior operator performance enabled by our approach makes a compelling case for its integration into deployable video-surveillance systems.
updated: Thu Dec 05 2019 16:35:00 GMT+0000 (UTC)
published: Thu Jul 19 2018 08:52:19 GMT+0000 (UTC)
