arXiv reaDer
個人の再識別のための類似性を保持する画像-画像ドメイン適応
Similarity-preserving Image-image Domain Adaptation for Person Re-identification
 この記事では、2つのコンポーネントで構成される「翻訳による学習」フレームワークの下での個人の再識別(re-ID)におけるドメイン適応問題を調査します。1)ラベル付きイメージをソースからターゲットドメインに教師なしで翻訳)翻訳された画像を使用してre-IDモデルを学習します。目的は、画像の翻訳後に基礎となる人間のID情報を保持することです。そのため、ラベル付きの翻訳された画像は、ターゲットドメインでの特徴学習に有効です。この目的のために、類似性を保持する生成的敵対ネットワーク(SPGAN)とそのエンドツーエンドのトレーニング可能なバージョンであるeSPGANを提案します。両方の類似性を維持することを目的として、SPGANはヒューリスティック制約によってこのプロパティを適用しますが、eSPGANはre-IDモデルの学習を最適に促進することによって実行します。より具体的には、SPGANは「翻訳による学習」フレームワークの2つのコンポーネントを別々に引き受けます。最初に、2種類の教師なし類似性、つまり、翻訳前後の画像の自己相似性、および翻訳されたソース画像とターゲット画像のドメイン非相似性を保持します。次に、既存のネットワークを使用してre-IDモデルを学習します。それに比べて、eSPGANは、画像変換とre-IDモデル学習をシームレスに統合します。 eSPGANのエンドツーエンドトレーニング中に、re-IDラーニングは画像変換をガイドして、画像の基礎となるID情報を保持します。一方、画像変換は、ターゲットドメインスタイルのアイデンティティ保存トレーニングサンプルを提供することにより、re-ID学習を改善します。実験では、SPGANおよびeSPGANによって生成された偽の画像のIDが十分に保存されていることを示します。これに基づいて、2つの大規模な個人のre-IDデータセットに関する新しい最先端のドメイン適応結果を報告します。
This article studies the domain adaptation problem in person re-identification (re-ID) under a "learning via translation" framework, consisting of two components, 1) translating the labeled images from the source to the target domain in an unsupervised manner, 2) learning a re-ID model using the translated images. The objective is to preserve the underlying human identity information after image translation, so that translated images with labels are effective for feature learning on the target domain. To this end, we propose a similarity preserving generative adversarial network (SPGAN) and its end-to-end trainable version, eSPGAN. Both aiming at similarity preserving, SPGAN enforces this property by heuristic constraints, while eSPGAN does so by optimally facilitating the re-ID model learning. More specifically, SPGAN separately undertakes the two components in the "learning via translation" framework. It first preserves two types of unsupervised similarity, namely, self-similarity of an image before and after translation, and domain-dissimilarity of a translated source image and a target image. It then learns a re-ID model using existing networks. In comparison, eSPGAN seamlessly integrates image translation and re-ID model learning. During the end-to-end training of eSPGAN, re-ID learning guides image translation to preserve the underlying identity information of an image. Meanwhile, image translation improves re-ID learning by providing identity-preserving training samples of the target domain style. In the experiment, we show that identities of the fake images generated by SPGAN and eSPGAN are well preserved. Based on this, we report the new state-of-the-art domain adaptation results on two large-scale person re-ID datasets.
updated: Sun Jan 05 2020 12:11:01 GMT+0000 (UTC)
published: Mon Nov 26 2018 17:56:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト