arXiv reaDer
教師なし人の再識別のための浄化の学習
Learning to Purification for Unsupervised Person Re-identification
教師なしの人の再識別は、コンピュータビジョンにおける挑戦的で有望なタスクです。今日、教師なしの人の再識別方法は、疑似ラベルを使用したトレーニングによって大きな進歩を遂げています。ただし、特徴とラベルのノイズを浄化する方法は、教師なしの方法ではあまり明確に研究されていません。機能を浄化するために、異なるローカルビューからの2種類の追加機能を考慮して、機能表現を充実させます。提案されたマルチビュー機能は、クラスターコントラスト学習に注意深く統合されており、グローバル機能が簡単に無視およびバイアスされるより識別力のある手がかりを活用します。ラベルノイズを浄化するために、オフラインスキームで教師モデルの知識を活用することを提案します。具体的には、最初にノイズの多い疑似ラベルから教師モデルをトレーニングし、次に教師モデルを使用して生徒モデルの学習をガイドします。私たちの設定では、生徒のモデルは教師のモデルの監視にすばやく収束できるため、教師のモデルが大きく苦しんでいるため、ノイズの多いラベルの干渉を減らすことができます。特徴学習のノイズとバイアスを注意深く処理した後、私たちの浄化モジュールは、教師なしの人の再識別に非常に効果的であることが証明されています。 3つの人気のある人物の再識別データセットに関する広範な実験は、私たちの方法の優位性を示しています。特に、私たちのアプローチは、完全に監視されていない設定でResNet-50を使用した挑戦的なMarket-1501ベンチマークで、最先端の精度85.8%@ mAPおよび94.5%@Rank-1を達成します。コードがリリースされます。
Unsupervised person re-identification is a challenging and promising task in computer vision. Nowadays unsupervised person re-identification methods have achieved great progress by training with pseudo labels. However, how to purify feature and label noise is less explicitly studied in the unsupervised manner. To purify the feature, we take into account two types of additional features from different local views to enrich the feature representation. The proposed multi-view features are carefully integrated into our cluster contrast learning to leverage more discriminative cues that the global feature easily ignored and biased. To purify the label noise, we propose to take advantage of the knowledge of teacher model in an offline scheme. Specifically, we first train a teacher model from noisy pseudo labels, and then use the teacher model to guide the learning of our student model. In our setting, the student model could converge fast with the supervision of the teacher model thus reduce the interference of noisy labels as the teacher model greatly suffered. After carefully handling the noise and bias in the feature learning, our purification modules are proven to be very effective for unsupervised person re-identification. Extensive experiments on three popular person re-identification datasets demonstrate the superiority of our method. Especially, our approach achieves a state-of-the-art accuracy 85.8% @mAP and 94.5% @Rank-1 on the challenging Market-1501 benchmark with ResNet-50 under the fully unsupervised setting. The code will be released.
updated: Wed Jun 22 2022 07:28:56 GMT+0000 (UTC)
published: Thu Apr 21 2022 07:46:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト