arXiv reaDer
ノイズを修正: 制御可能なドメイン変換のためのソース機能のもつれを解く
Fix the Noise: Disentangling Source Feature for Controllable Domain Translation
最近の研究では、特に無条件ジェネレーターで転移学習技術を使用することにより、ドメイン変換で強力な生成パフォーマンスが示されています。ただし、単一のモデルを使用して異なるドメイン機能を制御することは依然として困難です。既存の方法では多くの場合、追加のモデルが必要になりますが、これは計算量が多く、満足のいく視覚的品質につながりません。さらに、制御ステップが制限されているため、スムーズな移行が妨げられます。この論文では、より優れた制御性を備えた高品質のドメイン変換のための新しいアプローチを提案します。重要なアイデアは、ソース フィーチャをターゲット フィーチャ空間の絡み合っていないサブスペース内に保持することです。これにより、単一のモデルのみを使用してまったく新しいドメインから画像を生成しながら、ソース機能を保持する程度をスムーズに制御できます。私たちの広範な実験は、提案された方法が以前の研究よりも一貫性のある現実的な画像を生成し、さまざまなレベルの変換で正確な制御性を維持できることを示しています。コードは https://github.com/LeeDongYeun/FixNoise で入手できます。
Recent studies show strong generative performance in domain translation especially by using transfer learning techniques on the unconditional generator. However, the control between different domain features using a single model is still challenging. Existing methods often require additional models, which is computationally demanding and leads to unsatisfactory visual quality. In addition, they have restricted control steps, which prevents a smooth transition. In this paper, we propose a new approach for high-quality domain translation with better controllability. The key idea is to preserve source features within a disentangled subspace of a target feature space. This allows our method to smoothly control the degree to which it preserves source features while generating images from an entirely new domain using only a single model. Our extensive experiments show that the proposed method can produce more consistent and realistic images than previous works and maintain precise controllability over different levels of transformation. The code is available at https://github.com/LeeDongYeun/FixNoise.
updated: Tue Mar 21 2023 02:19:48 GMT+0000 (UTC)
published: Tue Mar 21 2023 02:19:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト