Towards Discriminative Representation Learning for Unsupervised Person Re-identification
この作業では、注釈がソースドメインでは利用できるが、ターゲットでは利用できない、個人のre-IDに対する監視されていないドメイン適応の問題に対処します。以前の方法は通常、2段階の最適化パイプラインに従います。このパイプラインでは、ネットワークは最初にソースで事前トレーニングされ、次に機能クラスタリングによって作成された疑似ラベルを使用してターゲットで微調整されます。このような方法には、2つの主な制限があります。 (1)ラベルノイズは、ターゲットクラスを認識するための識別機能の学習を妨げる可能性があります。 (2)ドメインギャップは、ソースからターゲットへの知識の伝達を妨げる可能性があります。これらの問題を軽減するために、3種類の技術スキームを提案します。まず、監視されていない方法でノイズ耐性のある表現を学習するために、特徴学習とクラスターリファイナリーの反復最適化によるクラスターワイズコントラスト学習アルゴリズム(CCL)を提案します。次に、プログレッシブドメインアダプテーション(PDA)戦略を採用して、ソースデータとターゲットデータ間のドメインギャップを徐々に緩和します。第三に、フーリエ空間に追加の制約を課すことにより、re-IDモデルのクラス分離可能性をさらに最大化するためのフーリエ増強(FA)を提案します。これらの提案されたスキームは、識別可能な特徴表現の学習を容易にすることができることを観察します。実験は、私たちの方法が、複数のベンチマークで最先端の監視されていないre-ID方法に比べて一貫して顕著な改善を達成していることを示しています。たとえば、市場でMMTを8.1%、9.9%、11.4%、11.1%mAP上回っています。 -それぞれ、デューク、デュークからマーケット、マーケットからMSMT、デュークからMSMTのタスク。
In this work, we address the problem of unsupervised domain adaptation for person re-ID where annotations are available for the source domain but not for target. Previous methods typically follow a two-stage optimization pipeline, where the network is first pre-trained on source and then fine-tuned on target with pseudo labels created by feature clustering. Such methods sustain two main limitations. (1) The label noise may hinder the learning of discriminative features for recognizing target classes. (2) The domain gap may hinder knowledge transferring from source to target. We propose three types of technical schemes to alleviate these issues. First, we propose a cluster-wise contrastive learning algorithm (CCL) by iterative optimization of feature learning and cluster refinery to learn noise-tolerant representations in the unsupervised manner. Second, we adopt a progressive domain adaptation (PDA) strategy to gradually mitigate the domain gap between source and target data. Third, we propose Fourier augmentation (FA) for further maximizing the class separability of re-ID models by imposing extra constraints in the Fourier space. We observe that these proposed schemes are capable of facilitating the learning of discriminative feature representations. Experiments demonstrate that our method consistently achieves notable improvements over the state-of-the-art unsupervised re-ID methods on multiple benchmarks, e.g., surpassing MMT largely by 8.1%, 9.9%, 11.4% and 11.1% mAP on the Market-to-Duke, Duke-to-Market, Market-to-MSMT and Duke-to-MSMT tasks, respectively.
updated: Sat Aug 07 2021 12:35:21 GMT+0000 (UTC)
published: Sat Aug 07 2021 12:35:21 GMT+0000 (UTC)
