SPA-GAN: Spatial Attention GAN for Image-to-Image Translation
 画像から画像への変換は、ソースドメインの画像とターゲットドメインの画像間のマッピングを学習することです。この論文では、生成的敵対的ネットワーク(GAN)アーキテクチャに直接注意メカニズムを導入し、画像から画像への変換タスクのための新しい空間注意GANモデル(SPA-GAN)を提案します。 SPA-GANは、その弁別器で注意を計算し、それを使用して、ジェネレーターがソースドメインとターゲットドメインの間の最も識別力のある領域に集中できるようにし、よりリアルな出力画像を導きます。また、翻訳中にドメイン固有の機能を維持するために、SPA-GANトレーニングで追加の機能マップ損失を導入することも役立ちます。既存の注意誘導GANモデルと比較すると、SPA-GANは、追加の注意ネットワークや監視を必要としない軽量モデルです。ベンチマークデータセットでの最先端の手法に対する定性的および定量的な比較は、SPA-GANの優れたパフォーマンスを示しています。
Image-to-image translation is to learn a mapping between images from a source domain and images from a target domain. In this paper, we introduce the attention mechanism directly to the generative adversarial network (GAN) architecture and propose a novel spatial attention GAN model (SPA-GAN) for image-to-image translation tasks. SPA-GAN computes the attention in its discriminator and use it to help the generator focus more on the most discriminative regions between the source and target domains, leading to more realistic output images. We also find it helpful to introduce an additional feature map loss in SPA-GAN training to preserve domain specific features during translation. Compared with existing attention-guided GAN models, SPA-GAN is a lightweight model that does not need additional attention networks or supervision. Qualitative and quantitative comparison against state-of-the-art methods on benchmark datasets demonstrates the superior performance of SPA-GAN.
updated: Wed Dec 30 2020 22:46:05 GMT+0000 (UTC)
published: Mon Aug 19 2019 07:09:05 GMT+0000 (UTC)
