Semantics-Aligned Representation Learning for Person Re-identification
 人物の再識別(reID)は、人物の画像を照合して、同一のIDを持つ画像を取得することを目的としています。これは、人間のポーズやキャプチャの視点の多様性、目に見える体の不完全性(オクルージョンによる)などにより、一致する画像が一般に意味的にずれているため、困難な作業です。この論文では、駆動するフレームワークを提案しますreIDネットワークを使用して、デリケートな監督設計を通じてセマンティクスに合わせた機能表現を学習します。具体的には、re-IDのエンコーダー(SA-Enc)としてのベースネットワークと、密集したセマンティクスが整列したフルテクスチャイメージを再構築/回帰するためのデコーダー(SA-Dec)で構成されるSemantics Aligning Network(SAN)を構築します。私たちは、人の再識別と整列したテクスチャ生成の監督の下で、SANを共同でトレーニングします。さらに、デコーダでは、再構成損失に加えて、機能マップ上にトリプレットReID制約を知覚的損失として追加します。デコーダは推論で破棄されるため、このスキームは計算効率が高くなります。アブレーション研究は、デザインの有効性を実証しています。ベンチマークデータセットCUHK03、Market1501、MSMT17、およびパーシャルパーソンreIDデータセットPartial REIDで最先端のパフォーマンスを実現しています。提案された方法のコードは、で入手できます。
Person re-identification (reID) aims to match person images to retrieve the ones with the same identity. This is a challenging task, as the images to be matched are generally semantically misaligned due to the diversity of human poses and capture viewpoints, incompleteness of the visible bodies (due to occlusion), etc. In this paper, we propose a framework that drives the reID network to learn semantics-aligned feature representation through delicate supervision designs. Specifically, we build a Semantics Aligning Network (SAN) which consists of a base network as encoder (SA-Enc) for re-ID, and a decoder (SA-Dec) for reconstructing/regressing the densely semantics aligned full texture image. We jointly train the SAN under the supervisions of person re-identification and aligned texture generation. Moreover, at the decoder, besides the reconstruction loss, we add Triplet ReID constraints over the feature maps as the perceptual losses. The decoder is discarded in the inference and thus our scheme is computationally efficient. Ablation studies demonstrate the effectiveness of our design. We achieve the state-of-the-art performances on the benchmark datasets CUHK03, Market1501, MSMT17, and the partial person reID dataset Partial REID. Code for our proposed method is available at:
updated: Wed Mar 18 2020 13:02:27 GMT+0000 (UTC)
published: Thu May 30 2019 16:09:28 GMT+0000 (UTC)
