一般化可能な人物の再識別(ReID)は、新しい環境でモデルを再トレーニングする必要なしに、すぐに使用できるReIDモデルを提供するため、最近のコンピュータービジョンコミュニティでますます注目を集めています。この作業では、人のReIDに因果関係を導入し、一般化可能な人の再識別(DIR-ReID)のドメイン不変表現という名前の新しい一般化可能なフレームワークを提案します。データ生成プロセスは、2セットの要因、つまりID関連の手がかりを含むID固有の要因と、ドメイン間での分布シフトを引き起こす他のシーン関連情報を記述するドメイン固有の要因によって制御されると想定しています。上記の仮定の下で、新しいマルチドメイン解きほぐされた敵対的ネットワーク(MDDAN)は、これら2つの要素のセットを解きほぐすように設計されています。さらに、因果学習の観点から潜在要因への介入として説明できる、より良いドメイン不変表現のための機能レベルのデータ増強を実行するために、因果データ拡張(CDA)ブロックが提案されています。広範な実験が行われ、DIR-ReIDが大規模ドメイン一般化(DG)ReIDベンチマークで最先端の方法よりも優れていることが示されています。さらに、理論的分析は、私たちの方法をよりよく理解するために提供されています。
Generalizable person Re-Identification (ReID) has attracted growing attention in recent computer vision community, as it offers ready-to-use ReID models without the need for model retraining in new environments. In this work, we introduce causality into person ReID and propose a novel generalizable framework, named Domain Invariant Representations for generalizable person Re-Identification (DIR-ReID). We assume the data generation process is controlled by two sets of factors, i.e. identity-specific factors containing identity related cues, and domain-specific factors describing other scene-related information which cause distribution shifts across domains. With the assumption above, a novel Multi-Domain Disentangled Adversarial Network (MDDAN) is designed to disentangle these two sets of factors. Furthermore, a Causal Data Augmentation (CDA) block is proposed to perform feature-level data augmentation for better domain-invariant representations, which can be explained as interventions on latent factors from a causal learning perspective. Extensive experiments have been conducted, showing that DIR-ReID outperforms state-of-the-art methods on large-scale domain generalization (DG) ReID benchmarks. Moreover, a theoretical analysis is provided for a better understanding of our method.