arXiv reaDer
半教師付き人物再識別のためのプログレッシブクロスカメラソフトラベル学習
Progressive Cross-camera Soft-label Learning for Semi-supervised Person Re-identification
 このホワイトペーパーでは、カメラ内(カメラ内)のラベルのみがあり、カメラ間(カメラ間)のラベルはない、半監視下の人物の再識別(Re-ID)ケースに焦点を当てます。実際のアプリケーションでは、これらのカメラ内ラベルは、クロスカメララベルと比較すると、追跡アルゴリズムまたはいくつかの手動注釈によって簡単にキャプチャできます。この場合、クロスカメラのラベル情報が不足しているため、トレーニング段階でクロスカメラの人物間の関係を調査することは非常に困難です。この問題に対処するために、半監視者のRe-IDタスク用の新しいプログレッシブクロスカメラソフトラベル学習(PCSL)フレームワークを提案します。これは、クロスカメラソフトラベルを生成し、ネットワークを最適化するために利用できます。具体的には、人物レベルの特徴に基づいてアフィニティマトリックスを計算し、それらを適合させて、クロスカメラの人物(つまり、クロスカメラのソフトラベル)間の類似性を生成します。これらのソフトラベルを活用してネットワークをトレーニングするには、分類と識別の観点から、それぞれ、加重クロスエントロピー損失と加重トリプレット損失を調査します。特に、提案されたフレームワークは、プログレッシブクロスカメラソフトラベルを交互に生成し、学習コース全体での特徴表現を徐々に改善します。 5つの大規模ベンチマークデータセットでの広範囲な実験は、PCSLが、ラベル付きソースドメインまたはGANベースのモデルによって生成された画像を使用する最先端の教師なし手法よりも大幅に優れていることを示しています。さらに、提案された方法は、深く監視されたRe-ID方法に関しても競争力のある性能を持っています。
In this paper, we focus on the semi-supervised person re-identification (Re-ID) case, which only has the intra-camera (within-camera) labels but not inter-camera (cross-camera) labels. In real-world applications, these intra-camera labels can be readily captured by tracking algorithms or few manual annotations, when compared with cross-camera labels. In this case, it is very difficult to explore the relationships between cross-camera persons in the training stage due to the lack of cross-camera label information. To deal with this issue, we propose a novel Progressive Cross-camera Soft-label Learning (PCSL) framework for the semi-supervised person Re-ID task, which can generate cross-camera soft-labels and utilize them to optimize the network. Concretely, we calculate an affinity matrix based on person-level features and adapt them to produce the similarities between cross-camera persons (i.e., cross-camera soft-labels). To exploit these soft-labels to train the network, we investigate the weighted cross-entropy loss and the weighted triplet loss from the classification and discrimination perspectives, respectively. Particularly, the proposed framework alternately generates progressive cross-camera soft-labels and gradually improves feature representations in the whole learning course. Extensive experiments on five large-scale benchmark datasets show that PCSL significantly outperforms the state-of-the-art unsupervised methods that employ labeled source domains or the images generated by the GAN-based models. Furthermore, the proposed method even has a competitive performance with respect to deep supervised Re-ID methods.
updated: Tue Mar 24 2020 15:34:39 GMT+0000 (UTC)
published: Thu Aug 15 2019 00:19:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト