arXiv reaDer
解きほぐし学習のための半教師ありStyleGAN
Semi-Supervised StyleGAN for Disentanglement Learning
解きほぐし学習は、解きほぐされた表現と制御可能な生成を取得するために重要です。現在の解きほぐし方法は、いくつかの固有の制限に直面しています。主に解きほぐされた表現の学習に焦点を当てた高解像度画像の難しさ、および教師なし設定による識別不能性です。これらの制限を緩和するために、半教師あり高解像度解きほぐし学習のために、StyleGAN(Karras et al。、2019)に基づいて新しいアーキテクチャと損失関数を設計します。体系的なテストのために、2つの複雑な高解像度合成データセットを作成します。限定的な監視の影響を調査し、ラベル付けされたデータの0.25%〜2.5%のみを使用するだけで、合成データセットと実際のデータセットの両方で適切な解きほぐしができることを発見しました。ジェネレータの制御可能性を定量化するための新しいメトリックを提案し、解きほぐされた表現学習と制御可能な生成の間に重大なトレードオフが存在する可能性があることを観察します。また、セマンティックのきめ細かい画像編集を検討して、見えない画像へのより良い一般化を実現します。
Disentanglement learning is crucial for obtaining disentangled representations and controllable generation. Current disentanglement methods face several inherent limitations: difficulty with high-resolution images, primarily focusing on learning disentangled representations, and non-identifiability due to the unsupervised setting. To alleviate these limitations, we design new architectures and loss functions based on StyleGAN (Karras et al., 2019), for semi-supervised high-resolution disentanglement learning. We create two complex high-resolution synthetic datasets for systematic testing. We investigate the impact of limited supervision and find that using only 0.25%~2.5% of labeled data is sufficient for good disentanglement on both synthetic and real datasets. We propose new metrics to quantify generator controllability, and observe there may exist a crucial trade-off between disentangled representation learning and controllable generation. We also consider semantic fine-grained image editing to achieve better generalization to unseen images.
updated: Wed Nov 25 2020 23:06:53 GMT+0000 (UTC)
published: Fri Mar 06 2020 22:54:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト