このペーパーでは、主に1つの例と少ない例のビデオ人物の再識別について説明します。ローカルおよびグローバルな機能を共同で学習するマルチブランチネットワークPAMが提案されています。 PAMの精度は高く、パラメータはほとんどなく、高速で収束するため、少数の例の人物の再識別に適しています。ラベルのないサンプルのラベルを繰り返し推定し、それらをトレーニングセットに組み込み、より堅牢なネットワークをトレーニングします。クラス間の相対距離に基づく静的相対距離サンプリング(SRD)戦略を提案します。 SRDがすべてのラベルなしサンプルを使用できないという問題については、適応相対距離サンプリング(ARD)戦略を提案します。一例の設定では、PRID2011とiLIDS-VIDでそれぞれ89.78 \%、56.13 \%ランク1の精度が得られ、DukeMTMCとMARSでそれぞれ85.16 \%、45.36 \%のmAPが得られます。 。
This paper mainly studies one-example and few-example video person re-identification. A multi-branch network PAM that jointly learns local and global features is proposed. PAM has high accuracy, few parameters and converges fast, which is suitable for few-example person re-identification. We iteratively estimates labels for unlabeled samples, incorporates them into training sets, and trains a more robust network. We propose the static relative distance sampling(SRD) strategy based on the relative distance between classes. For the problem that SRD can not use all unlabeled samples, we propose adaptive relative distance sampling (ARD) strategy. For one-example setting, We get 89.78\%, 56.13\% rank-1 accuracy on PRID2011 and iLIDS-VID respectively, and 85.16\%, 45.36\% mAP on DukeMTMC and MARS respectively, which exceeds the previous methods by large margin.