arXiv reaDer
教師なし画像から画像への変換のための解きほぐされた潜在スタイル空間の平滑化
Smoothing the Disentangled Latent Style Space for Unsupervised Image-to-Image Translation
Image-to-Image(I2I)マルチドメイン変換モデルは、通常、セマンティック補間結果の品質も使用して評価されます。ただし、最先端のモデルでは、補間中に画像の外観が急激に変化することがよくあり、通常、ドメイン間の補間ではパフォーマンスが低下します。この論文では、翻訳ネットワークが次のような滑らかで解きほぐされた潜在的なスタイル空間を学習するのに役立つ3つの特定の損失に基づく新しいトレーニングプロトコルを提案します。1)ドメイン内補間とドメイン間補間の両方が生成された画像の段階的な変化に対応する2)ソース画像のコンテンツは、翻訳中によりよく保存されます。さらに、I2I翻訳モデルの潜在的なスタイル空間の滑らかさを適切に測定するための新しい評価指標を提案します。提案された方法は、既存の翻訳アプローチにプラグインすることができ、さまざまなデータセットでの広範な実験により、生成された画像の品質と補間の段階性を大幅に向上させることができることが示されています。
Image-to-Image (I2I) multi-domain translation models are usually evaluated also using the quality of their semantic interpolation results. However, state-of-the-art models frequently show abrupt changes in the image appearance during interpolation, and usually perform poorly in interpolations across domains. In this paper, we propose a new training protocol based on three specific losses which help a translation network to learn a smooth and disentangled latent style space in which: 1) Both intra- and inter-domain interpolations correspond to gradual changes in the generated images and 2) The content of the source image is better preserved during the translation. Moreover, we propose a novel evaluation metric to properly measure the smoothness of latent style space of I2I translation models. The proposed method can be plugged into existing translation approaches, and our extensive experiments on different datasets show that it can significantly boost the quality of the generated images and the graduality of the interpolations.
updated: Wed Jun 16 2021 17:58:21 GMT+0000 (UTC)
published: Wed Jun 16 2021 17:58:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト