Generative Adversarial Networks (GAN) 反転の忠実度は、画像内の Out-Of-Domain (OOD) 領域 (背景、アクセサリーなど) によって妨げられます。事前トレーニングされたモデルの生成能力を超えた OOD 領域を検出し、これらの領域を入力画像とブレンドすることで、忠実度を高めることができます。 「可逆性マスク」はこれらの OOD 領域を把握し、既存の手法では再構成誤差を含めてマスクを予測します。ただし、通常、推定されたマスクは、ドメイン内 (ID) 領域の再構成誤差の影響により不正確になります。この論文では、入力画像を反転マスクを使用して ID および OOD パーティションに分解する新しいモジュールを設計することにより、人間の顔の反転の忠実度を高める新しいフレームワークを提案します。以前の作品とは異なり、反転性検出器は空間アライメント モジュールと同時に学習されます。生成されたフィーチャを入力ジオメトリに繰り返し位置合わせし、ID 領域の再構成エラーを削減します。したがって、OOD エリアはより区別しやすくなり、正確に予測できます。次に、入力画像の OOD 領域と ID GAN 反転結果をブレンドすることで、結果の忠実度を向上させます。私たちの方法では、現実世界の人間の顔画像の反転と操作に対してフォトリアリスティックな結果が得られます。広範な実験により、GAN 反転と属性操作の品質において、既存の方法よりも私たちの方法が優れていることが実証されました。
The fidelity of Generative Adversarial Networks (GAN) inversion is impeded by Out-Of-Domain (OOD) areas (e.g., background, accessories) in the image. Detecting the OOD areas beyond the generation ability of the pre-trained model and blending these regions with the input image can enhance fidelity. The "invertibility mask" figures out these OOD areas, and existing methods predict the mask with the reconstruction error. However, the estimated mask is usually inaccurate due to the influence of the reconstruction error in the In-Domain (ID) area. In this paper, we propose a novel framework that enhances the fidelity of human face inversion by designing a new module to decompose the input images to ID and OOD partitions with invertibility masks. Unlike previous works, our invertibility detector is simultaneously learned with a spatial alignment module. We iteratively align the generated features to the input geometry and reduce the reconstruction error in the ID regions. Thus, the OOD areas are more distinguishable and can be precisely predicted. Then, we improve the fidelity of our results by blending the OOD areas from the input image with the ID GAN inversion results. Our method produces photo-realistic results for real-world human face image inversion and manipulation. Extensive experiments demonstrate our method's superiority over existing methods in the quality of GAN inversion and attribute manipulation.