arXiv reaDer
半教師ありドメインの一般化可能な個人の再識別
Semi-Supervised Domain Generalizable Person Re-Identification
既存の人物の再識別(re-id)メソッドは、カメラ間の人物マッチングが成功したにもかかわらず、新しい目に見えないシナリオに展開されたときにスタックします。最近の取り組みは、ドメイン適応型の人のre-idに実質的に専念しており、新しいシナリオのラベルのない広範なデータがトランスダクティブ学習の方法で利用されています。ただし、シナリオごとに、最初に十分なデータを収集してから、そのようなドメイン適応型re-idモデルをトレーニングする必要があるため、実際のアプリケーションが制限されます。代わりに、複数のラベル付きデータセットを探索して、個人のre-idの一般化されたドメイン不変表現を学習することを目指しています。これは、新しいre-idシナリオごとに普遍的に効果的であると期待されます。実世界のシステムでの実用性を追求するために、このフィールドですべての人物re-idデータセット(20データセット)を収集し、最も頻繁に使用される3つのデータセット(Market1501、DukeMTMC、MSMT17)を非表示のターゲットドメインとして選択します。さらに、YouTubeストリートビュービデオからYouTube-Humanという名前の30万以上の弱い注釈付き画像を収集するDataHunterを開発します。これは、残りの17の完全なラベル付きデータセットを結合して複数のソースドメインを形成します。 FastHuman(〜440K +ラベル付き画像)と呼ばれるこのような大きくてやりがいのあるベンチマークで、シンプルでありながら効果的な半教師あり知識蒸留(SSKD)フレームワークをさらに提案します。 SSKDは、モデルの一般化能力を向上させるためにYouTube-Humanにソフト疑似ラベルを割り当てることにより、弱く注釈が付けられたデータを効果的に活用します。いくつかのプロトコルでの実験により、ドメインの一般化可能な人物のre-idに対する提案されたSSKDフレームワークの有効性が検証されます。これは、ターゲットドメインでの教師あり学習にさえ匹敵します。最後に、しかし最も重要なこととして、提案されたベンチマークFastHumanが、ドメインの一般化可能な人物re-idアルゴリズムの次の開発をもたらすことを願っています。
Existing person re-identification (re-id) methods are stuck when deployed to a new unseen scenario despite the success in cross-camera person matching. Recent efforts have been substantially devoted to domain adaptive person re-id where extensive unlabeled data in the new scenario are utilized in a transductive learning manner. However, for each scenario, it is required to first collect enough data and then train such a domain adaptive re-id model, thus restricting their practical application. Instead, we aim to explore multiple labeled datasets to learn generalized domain-invariant representations for person re-id, which is expected universally effective for each new-coming re-id scenario. To pursue practicability in real-world systems, we collect all the person re-id datasets (20 datasets) in this field and select the three most frequently used datasets (i.e., Market1501, DukeMTMC, and MSMT17) as unseen target domains. In addition, we develop DataHunter that collects over 300K+ weak annotated images named YouTube-Human from YouTube street-view videos, which joins 17 remaining full labeled datasets to form multiple source domains. On such a large and challenging benchmark called FastHuman (~440K+ labeled images), we further propose a simple yet effective Semi-Supervised Knowledge Distillation (SSKD) framework. SSKD effectively exploits the weakly annotated data by assigning soft pseudo labels to YouTube-Human to improve models' generalization ability. Experiments on several protocols verify the effectiveness of the proposed SSKD framework on domain generalizable person re-id, which is even comparable to supervised learning on the target domains. Lastly, but most importantly, we hope the proposed benchmark FastHuman could bring the next development of domain generalizable person re-id algorithms.
updated: Thu Sep 09 2021 02:54:03 GMT+0000 (UTC)
published: Wed Aug 11 2021 06:08:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト