arXiv reaDer
TransGaGa: ジオメトリを意識した教師なし画像-画像変換
TransGaGa: Geometry-Aware Unsupervised Image-to-Image Translation
教師なし画像-画像変換は、2つの視覚領域間のマッピングを学習することを目的としている。しかし、大きな幾何学的変化にまたがる翻訳の学習は、常に失敗に終わる。本研究では、複雑なオブジェクトの画像-画像変換タスクに取り組むために、新しい解きほぐし翻訳フレームワークを提案する。画像空間上のマッピングを直接学習するのではなく、外観と幾何学的な潜在空間の直交積に画像空間を分解する。具体的には、まず幾何学的な先行損失と条件付きVAE損失を導入し、ネットワークが独立しているが相補的な表現を学習するように促す。その後、外観空間と幾何学空間を別々に変換していく。広範な実験により、我々の手法が他の最先端のアプローチよりも優れた性能を発揮することが実証された。さらに、異なる例を外観参照として用いることで、マルチモーダル変換もサポートする。プロジェクトページ: https://wywu.github.io/projects/TGaGa/TGaGa.html
Unsupervised image-to-image translation aims at learning a mapping between two visual domains. However, learning a translation across large geometry variations always ends up with failure. In this work, we present a novel disentangle-and-translate framework to tackle the complex objects image-to-image translation task. Instead of learning the mapping on the image space directly, we disentangle image space into a Cartesian product of the appearance and the geometry latent spaces. Specifically, we first introduce a geometry prior loss and a conditional VAE loss to encourage the network to learn independent but complementary representations. The translation is then built on appearance and geometry space separately. Extensive experiments demonstrate the superior performance of our method to other state-of-the-art approaches, especially in the challenging near-rigid and non-rigid objects translation tasks. In addition, by taking different exemplars as the appearance references, our method also supports multimodal translation. Project page: https://wywu.github.io/projects/TGaGa/TGaGa.html
updated: Sun Apr 21 2019 09:42:10 GMT+0000 (UTC)
published: Sun Apr 21 2019 09:42:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト