人物の再識別は、重複しないカメラ全体で個人を識別する問題です。再識別問題は目覚ましい進歩を遂げたとはいえ、同一人物の外見の違いや似たような外見の人がいるため、依然として難しい問題です。いくつかの以前の研究では、陽性サンプルの特徴を陰性サンプルの特徴から分離することで問題を解決していました。ただし、既存のモデルのパフォーマンスは、トレーニングに使用されるサンプルの特性と統計に大きく依存します。したがって、ランダムに選択されたサンプルから、絡み合っていない特徴の埋め込みを学習する、サンプリングに依存しない堅牢な特徴表現ネットワーク (SirNet) という新しいフレームワークを提案します。慎重に設計されたサンプリングに依存しない最大不一致損失は、クラスターとして同じ人物のサンプルをモデル化するために導入されます。その結果、提案されたフレームワークは、学習した特徴を使用して追加のハード ネガティブ/ポジティブを生成できます。これにより、他の ID との識別性が向上します。大規模なベンチマーク データセットに関する広範な実験結果により、提案されたモデルが以前の最先端のモデルよりも効果的であることが確認されています。
Person re-identification is a problem of identifying individuals across non-overlapping cameras. Although remarkable progress has been made in the re-identification problem, it is still a challenging problem due to appearance variations of the same person as well as other people of similar appearance. Some prior works solved the issues by separating features of positive samples from features of negative ones. However, the performances of existing models considerably depend on the characteristics and statistics of the samples used for training. Thus, we propose a novel framework named sampling independent robust feature representation network (SirNet) that learns disentangled feature embedding from randomly chosen samples. A carefully designed sampling independent maximum discrepancy loss is introduced to model samples of the same person as a cluster. As a result, the proposed framework can generate additional hard negatives/positives using the learned features, which results in better discriminability from other identities. Extensive experimental results on large-scale benchmark datasets verify that the proposed model is more effective than prior state-of-the-art models.