arXiv reaDer
教師なし条件付き生成のための二重サイクル一貫性のある生成的敵対的ネットワーク
Double cycle-consistent generative adversarial network for unsupervised conditional generation
条件付き生成モデルは、過去数年間でかなりの成功を収めていますが、通常、多くのラベル付きデータが必要です。最近、ClusterGANはGANとエンコーダーを組み合わせて、教師なし条件付き生成を介して優れたクラスタリングパフォーマンスを実現しています。ただし、データの実際の条件付き分布は無視されるため、クラスごとに生成されるサンプルの多様性が少なくなり、エンコーダーは最適ではないクラスタリングパフォーマンスのみを達成します。ここでは、さまざまなクラス条件付きサンプルを生成できる、新しい教師なし条件付き生成フレームワークであるダブルサイクル整合条件付きGAN(DC3-GAN)を提案します。エンコーダーとGANのジェネレーターを強制して、ジェネレーターとエンコーダーのペアに加えてエンコーダーとジェネレーターのペアを形成します。これにより、多様性の低い生成と潜在的な特徴の些細なことを回避できます。実際の条件付き分布を間接的に推定できる実際のデータを使用して、エンコーダーとジェネレーターのペアをトレーニングします。一方、このフレームワークは、エンコーダーの出力をGANの入力と以前のノイズ分布に一致させるように強制します。これにより、潜在空間が2つの部分(ワンホット離散変数と連続潜在変数)に解きほぐされます。前者はクラスターとして直接表現でき、後者は残りの不特定の要因を表します。この作業は、教師なし条件付き生成サンプルの多様性を強化すると、クラスタリングのパフォーマンスを向上できることを示しています。さまざまなベンチマークデータセットでの実験は、提案された方法が既存の生成モデルベースのクラスタリング方法よりも優れており、最適な解きほぐし性能も達成していることを示しています。
Conditional generative models have achieved considerable success in the past few years, but usually require a lot of labeled data. Recently, ClusterGAN combines GAN with an encoder to achieve remarkable clustering performance via unsupervised conditional generation. However, it ignores the real conditional distribution of data, which leads to generating less diverse samples for each class and makes the encoder only achieve sub-optimal clustering performance. Here, we propose a new unsupervised conditional generation framework, Double Cycle-Consistent Conditional GAN (DC3-GAN), which can generate diverse class-conditioned samples. We enforce the encoder and the generator of GAN to form an encoder-generator pair in addition to the generator-encoder pair, which enables us to avoid the low-diversity generation and the triviality of latent features. We train the encoder-generator pair using real data, which can indirectly estimate the real conditional distribution. Meanwhile, this framework enforces the outputs of the encoder to match the inputs of GAN and the prior noise distribution, which disentangles latent space into two parts: one-hot discrete and continuous latent variables. The former can be directly expressed as clusters and the latter represents remaining unspecified factors. This work demonstrates that enhancing the diversity of unsupervised conditional generated samples can improve the clustering performance. Experiments on different benchmark datasets show that the proposed method outperforms existing generative model-based clustering methods, and also achieves the optimal disentanglement performance.
updated: Mon Apr 05 2021 15:25:55 GMT+0000 (UTC)
published: Wed Nov 13 2019 00:11:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト