arXiv reaDer
もつれた潜在ベクトルを使用した顔属性編集
Face Attribute Editing with Disentangled Latent Vectors
もつれを解かれた解釈可能な潜在的な方向を使用して、顔の属性を編集するための画像から画像への変換フレームワークを提案します。顔の属性編集タスクは、編集中に他の属性を保持するために、属性の表現で制御可能な強度ともつれを解くことで、ターゲットを絞った属性編集の課題に直面しています。この目標のために、固定された事前トレーニング済み GAN の潜在空間分解作業に着想を得て、潜在空間分解による属性編集を設計し、各属性について、他の属性と直交する線形方向を学習します。これらの方向を、直交性の制約ともつれの解消の損失でトレーニングします。画像を意味的に整理された潜在空間に投影するために、注意ベースのスキップ接続を使用してエンコーダー/デコーダー アーキテクチャを設定します。以前の画像変換アルゴリズムと事前にトレーニングされた GAN による編集を広範囲に比較します。私たちの広範な実験は、私たちの方法が最先端技術よりも大幅に改善されていることを示しています。プロジェクトページ:https://yusufdalva.github.io/vecgan
We propose an image-to-image translation framework for facial attribute editing with disentangled interpretable latent directions. Facial attribute editing task faces the challenges of targeted attribute editing with controllable strength and disentanglement in the representations of attributes to preserve the other attributes during edits. For this goal, inspired by the latent space factorization works of fixed pretrained GANs, we design the attribute editing by latent space factorization, and for each attribute, we learn a linear direction that is orthogonal to the others. We train these directions with orthogonality constraints and disentanglement losses. To project images to semantically organized latent spaces, we set an encoder-decoder architecture with attention-based skip connections. We extensively compare with previous image translation algorithms and editing with pretrained GAN works. Our extensive experiments show that our method significantly improves over the state-of-the-arts. Project page: https://yusufdalva.github.io/vecgan
updated: Wed Jan 11 2023 18:32:13 GMT+0000 (UTC)
published: Wed Jan 11 2023 18:32:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト