Weakly Supervised Person Re-ID: Differentiable Graphical Learning and A New Benchmark
人の再識別(Re-ID)は、既存のデータセット(CUHK03 [1]やMarket-1501 [2]など)の正確な注釈から大きなメリットを得ます。これらのデータセットの各画像には、適切なラベル。この作業では、正確な注釈を不正確な注釈に置き換えることにより、Re-IDの注釈を緩和します。つまり、時間の観点から画像をバッグにグループ化し、各バッグにバッグレベルのラベルを割り当てます。これにより、注釈の労力が大幅に削減され、SYSU-30kと呼ばれる大規模なRe-IDベンチマークが作成されます。新しいベンチマークにはCUHK03(1.3k個人)とMarket-1501(1.5k個人)の約20倍の30k個人、およびImageNet(1kカテゴリ)の30倍の個人が含まれています。合計で29,606,918画像です。バッグレベルのアノテーションを使用してRe-IDモデルを学習することは、弱く監視されたRe-ID問題と呼ばれます。この問題を解決するために、バッグ内のすべての画像から依存関係をキャプチャし、各人物の画像に対して信頼できる疑似ラベルを生成する微分可能なグラフィカルモデルを導入します。疑似ラベルは、Re-IDモデルの学習を監視するためにさらに使用されます。完全に監視されたRe-IDモデルと比較すると、この方法はSYSU-30kおよびその他のデータセットで最先端のパフォーマンスを実現します。コード、データセット、事前トレーニング済みモデルは、で入手できます。
Person re-identification (Re-ID) benefits greatly from the accurate annotations of existing datasets (e.g., CUHK03 [1] and Market-1501 [2]), which are quite expensive because each image in these datasets has to be assigned with a proper label. In this work, we ease the annotation of Re-ID by replacing the accurate annotation with inaccurate annotation, i.e., we group the images into bags in terms of time and assign a bag-level label for each bag. This greatly reduces the annotation effort and leads to the creation of a large-scale Re-ID benchmark called SYSU-30k. The new benchmark contains 30k individuals, which is about 20 times larger than CUHK03 (1.3k individuals) and Market-1501 (1.5k individuals), and 30 times larger than ImageNet (1k categories). It sums up to 29,606,918 images. Learning a Re-ID model with bag-level annotation is called the weakly supervised Re-ID problem. To solve this problem, we introduce a differentiable graphical model to capture the dependencies from all images in a bag and generate a reliable pseudo label for each person image. The pseudo label is further used to supervise the learning of the Re-ID model. When compared with the fully supervised Re-ID models, our method achieves state-of-the-art performance on SYSU-30k and other datasets. The code, dataset, and pretrained model will be available at
updated: Wed Jul 15 2020 08:16:31 GMT+0000 (UTC)
published: Mon Apr 08 2019 05:27:53 GMT+0000 (UTC)
