arXiv reaDer
条件付きVAEの空間構造とスタイルのもつれを解く
Disentangling the Spatial Structure and Style in Conditional VAE
 この論文は、cVAEの潜在空間を相互に補完する空間構造とスタイルコードに解きほぐすことを目的としています。これらの1つはラベルに関連し、もう1つは無関係です。ジェネレーターは、接続されたエンコーダーデコーダーとラベル条件マッピングネットワークによって構築されます。ラベルが空間構造に関連しているかどうかに応じて、条件マッピングネットワークからの出力z_sがスタイルコードまたは空間構造コードのいずれかとして使用されます。エンコーダーは、z_uのサンプリング元となる無関係なラベルを提供します。デコーダーは、SPADEやAdaINなどの適応正規化により、各レイヤーでz_sとz_uを使用します。ラベルの種類が異なる2つのデータセットに対する広範な実験により、この方法の有効性が示されています。
This paper aims to disentangle the latent space in cVAE into the spatial structure and the style code, which are complementary to each other, with one of them z_s being label relevant and the other z_u irrelevant. The generator is built by a connected encoder-decoder and a label condition mapping network. Depending on whether the label is related with the spatial structure, the output z_s from the condition mapping network is used either as a style code or a spatial structure code. The encoder provides the label irrelevant posterior from which z_u is sampled. The decoder employs z_s and z_u in each layer by adaptive normalization like SPADE or AdaIN. Extensive experiments on two datasets with different types of labels show the effectiveness of our method.
updated: Wed Jul 15 2020 09:02:56 GMT+0000 (UTC)
published: Tue Oct 29 2019 03:14:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト