arXiv reaDer
個人の再識別のための教師なし事前トレーニング
Unsupervised Pre-training for Person Re-identification
この論文では、大規模なラベルなし人物再識別(Re-ID)データセット「LUPerson」を提示し、学習者のRe-ID特徴表現の一般化能力を向上させるための教師なし事前トレーニングの実行を初めて試みます。これは、データの注釈付けにコストのかかる作業が必要なため、既存のすべての個人Re-IDデータセットがすべて限られた規模であるという問題に対処するためです。以前の調査では、ImageNetで事前にトレーニングされたモデルを活用して、個人のRe-IDデータの不足を軽減しようとしていますが、ImageNetと個人のRe-IDデータの間のドメインギャップが大きいという問題があります。 LUPersonは、200Kを超えるIDの4M画像のラベルなしデータセットであり、既存の最大のRe-IDデータセットの30倍です。また、非常に多様なキャプチャ環境(カメラ設定、シーンなど)もカバーしています。このデータセットに基づいて、データの増強と対照的な損失という2つの観点からRe-ID機能を学習するための重要な要素を体系的に研究します。この大規模なデータセットに対して実行される教師なし事前トレーニングは、既存のすべての個人のRe-IDメソッドに役立つ一般的なRe-ID機能に効果的につながります。いくつかの基本的なフレームワークで事前にトレーニングされたモデルを使用して、私たちの方法は、広く使用されている4つのRe-IDデータセット(CUHK03、Market1501、DukeMTMC、およびMSMT17)でベルやホイッスルなしで最先端の結果を達成します。私たちの結果は、パフォーマンスの向上が小規模なターゲットデータセットまたは数ショットの設定でより重要であることも示しています。
In this paper, we present a large scale unlabeled person re-identification (Re-ID) dataset "LUPerson" and make the first attempt of performing unsupervised pre-training for improving the generalization ability of the learned person Re-ID feature representation. This is to address the problem that all existing person Re-ID datasets are all of limited scale due to the costly effort required for data annotation. Previous research tries to leverage models pre-trained on ImageNet to mitigate the shortage of person Re-ID data but suffers from the large domain gap between ImageNet and person Re-ID data. LUPerson is an unlabeled dataset of 4M images of over 200K identities, which is 30X larger than the largest existing Re-ID dataset. It also covers a much diverse range of capturing environments (eg, camera settings, scenes, etc.). Based on this dataset, we systematically study the key factors for learning Re-ID features from two perspectives: data augmentation and contrastive loss. Unsupervised pre-training performed on this large-scale dataset effectively leads to a generic Re-ID feature that can benefit all existing person Re-ID methods. Using our pre-trained model in some basic frameworks, our methods achieve state-of-the-art results without bells and whistles on four widely used Re-ID datasets: CUHK03, Market1501, DukeMTMC, and MSMT17. Our results also show that the performance improvement is more significant on small-scale target datasets or under few-shot setting.
updated: Sun Apr 25 2021 04:51:41 GMT+0000 (UTC)
published: Mon Dec 07 2020 14:48:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト