arXiv reaDer
任意の画像スタイル転送のための2ステージのピア正規化機能の再結合
Two-Stage Peer-Regularized Feature Recombination for Arbitrary Image Style Transfer
 このペーパーでは、ニューラルスタイルの転送モデルを紹介して、希望するスタイルを記述する一連の例に様式化された画像条件付けを生成します。提案されたソリューションは、ゼロショット設定でも高品質の画像を生成し、コンテンツジオメトリの変更の自由度を高めます。これは、カスタムグラフのたたみ込み層を使用して潜在空間のスタイルとコンテンツを再結合する新しい2ステージピア正規化層を導入することで可能になります。既存のソリューションの大部分とは異なり、私たちのモデルは、知覚損失を計算するために事前トレーニングされたネットワークに依存せず、潜在空間で直接動作する新しい一連の循環損失のおかげで完全にエンドツーエンドでトレーニングできます。 RGB画像上。広範なアブレーション研究により、提案された損失と2段階ピア正規化レイヤーの有用性が確認され、提示されたすべてのスタイルに対して単一のモデルを使用して、現在の技術水準に関して競争力のある定性的な結果が得られます。これにより、より抽象的で芸術的な神経画像生成シナリオへの扉が開き、モデルの展開がより簡単になります。
This paper introduces a neural style transfer model to generate a stylized image conditioning on a set of examples describing the desired style. The proposed solution produces high-quality images even in the zero-shot setting and allows for more freedom in changes to the content geometry. This is made possible by introducing a novel Two-Stage Peer-Regularization Layer that recombines style and content in latent space by means of a custom graph convolutional layer. Contrary to the vast majority of existing solutions, our model does not depend on any pre-trained networks for computing perceptual losses and can be trained fully end-to-end thanks to a new set of cyclic losses that operate directly in latent space and not on the RGB images. An extensive ablation study confirms the usefulness of the proposed losses and of the Two-Stage Peer-Regularization Layer, with qualitative results that are competitive with respect to the current state of the art using a single model for all presented styles. This opens the door to more abstract and artistic neural image generation scenarios, along with simpler deployment of the model.
updated: Sat Apr 11 2020 20:05:06 GMT+0000 (UTC)
published: Fri Jun 07 2019 06:14:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト