クラス不均衡データの他の低レベルの側面からオブジェクトのアイデンティティを解きほぐすことを学習する、新しい教師なし生成モデルを提案します。まず、InfoGANによる均一性に関する仮定を取り巻く問題を調査し、不均衡なデータ内のオブジェクトIDを適切に解きほぐす効果がないことを示します。私たちの重要なアイデアは、変化の離散潜在因子の発見を実画像のアイデンティティ保存変換に対して不変にし、それを信号として使用して、オブジェクトのアイデンティティを表す適切な潜在分布を学習することです。人工(MNIST、3D車、3D椅子、ShapeNet)と実世界(YouTube-Faces)の両方の不均衡なデータセットでの実験は、変動の潜在的要因としてオブジェクトのアイデンティティを解きほぐす方法の有効性を示しています。
We propose a novel unsupervised generative model that learns to disentangle object identity from other low-level aspects in class-imbalanced data. We first investigate the issues surrounding the assumptions about uniformity made by InfoGAN, and demonstrate its ineffectiveness to properly disentangle object identity in imbalanced data. Our key idea is to make the discovery of the discrete latent factor of variation invariant to identity-preserving transformations in real images, and use that as a signal to learn the appropriate latent distribution representing object identity. Experiments on both artificial (MNIST, 3D cars, 3D chairs, ShapeNet) and real-world (YouTube-Faces) imbalanced datasets demonstrate the effectiveness of our method in disentangling object identity as a latent factor of variation.