arXiv reaDer
周波数領域の画像変換:より写実的で、より優れたアイデンティティの保持
Frequency Domain Image Translation: More Photo-realistic, Better Identity-preserving
画像から画像への変換は、特定のスタイルの画像を別のスタイルに変換することを目的としています。合成された画像は、画像を解きほぐされた方法でコンテンツとスタイルに分解することにより、より写実的でアイデンティティを保持することができます。既存のモデルは、2つのコンポーネントを分離するための特殊なネットワークアーキテクチャの設計に重点を置いていますが、このペーパーでは、画像のコンテンツとスタイルの統計を明示的に制約する方法を調査します。この目標は、入力画像をコンテンツとスタイルにそれぞれ対応する高頻度と低頻度の情報に変換することで達成されます。度数分布を2つの側面から調整します。a)画像の度数分布を局所的に制限するための空間レベルの制限。 b)画像間のグローバルな一貫性を強化するためのスペクトルレベルの調整。複数のデータセットで、提案されたアプローチが、さまざまな最先端の画像変換モデルに加えて、一貫して大幅な改善につながることを示しています。
Image-to-image translation aims at translating a particular style of an image to another. The synthesized images can be more photo-realistic and identity-preserving by decomposing the image into content and style in a disentangled manner. While existing models focus on designing specialized network architecture to separate the two components, this paper investigates how to explicitly constrain the content and style statistics of images. We achieve this goal by transforming the input image into high frequency and low frequency information, which correspond to the content and style, respectively. We regulate the frequency distribution from two aspects: a) a spatial level restriction to locally restrict the frequency distribution of images; b) a spectral level regulation to enhance the global consistency among images. On multiple datasets we show that the proposed approach consistently leads to significant improvements on top of various state-of-the-art image translation models.
updated: Tue Dec 01 2020 04:19:17 GMT+0000 (UTC)
published: Fri Nov 27 2020 08:58:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト