過去数年にわたり、Generative Adversarial Networks(GAN)は、特に画像合成において顕著なパフォーマンスを示してきました。残念ながら、これらは不安定なトレーニングプロセスがあることでも知られており、異種の入力データのデータ分布の一部を失う可能性があります。本論文では、マルチモーダル分布学習(MMGAN)のための新しいGAN拡張を提案します。このアプローチでは、観測空間内の切断されたデータ多様体の数を参照するクラスター数を持つガウス混合モデルとして潜在空間をモデル化し、各データ多様体を1つのガウスクラスターに関連付けるクラスタリングネットワークを含めます。したがって、トレーニングはより安定します。さらに、MMGANでは、潜在空間の学習データ多様体に従って実データをクラスタリングできます。一連のベンチマーク実験により、MMGANがクラスタリングパフォーマンスの点で競合する最先端のモデルよりも優れていることを示します。
Over the past years, Generative Adversarial Networks (GANs) have shown a remarkable generation performance especially in image synthesis. Unfortunately, they are also known for having an unstable training process and might loose parts of the data distribution for heterogeneous input data. In this paper, we propose a novel GAN extension for multi-modal distribution learning (MMGAN). In our approach, we model the latent space as a Gaussian mixture model with a number of clusters referring to the number of disconnected data manifolds in the observation space, and include a clustering network, which relates each data manifold to one Gaussian cluster. Thus, the training gets more stable. Moreover, MMGAN allows for clustering real data according to the learned data manifold in the latent space. By a series of benchmark experiments, we illustrate that MMGAN outperforms competitive state-of-the-art models in terms of clustering performance.