arXiv reaDer
接続できないものを接続するための潜在空間と画像空間の位置合わせ
Aligning Latent and Image Spaces to Connect the Unconnectable
この作業では、多様で複雑なコンテンツを含む無限の高解像度画像を生成する方法を開発します。これは、画像と潜在空間で同期補間を行う完全な同変ジェネレータに基づいています。潜在コードは、サンプリングされると、座標グリッド上に配置され、各ピクセルは、近くのスタイルコードの補間から計算されます。このような設定で機能するようにAdaINメカニズムを変更し、敵対的な設定でジェネレーターをトレーニングして、任意の2つの潜在ベクトルの間に配置された画像を生成します。テスト時に、これにより、複雑で多様な無限の画像を生成し、2つの無関係なシーンを1つの任意の大きなパノラマに接続することができます。それとは別に、LHQを紹介します。\ lhqsize高解像度の自然景観の新しいデータセットです。 LHQ、LSUNタワー、LSUNブリッジでアプローチをテストし、生成された無限画像の品質と多様性の点で、ベースラインを少なくとも4倍上回っています。プロジェクトページはhttps://universome.github.io/alisにあります。
In this work, we develop a method to generate infinite high-resolution images with diverse and complex content. It is based on a perfectly equivariant generator with synchronous interpolations in the image and latent spaces. Latent codes, when sampled, are positioned on the coordinate grid, and each pixel is computed from an interpolation of the nearby style codes. We modify the AdaIN mechanism to work in such a setup and train the generator in an adversarial setting to produce images positioned between any two latent vectors. At test time, this allows for generating complex and diverse infinite images and connecting any two unrelated scenes into a single arbitrarily large panorama. Apart from that, we introduce LHQ: a new dataset of \lhqsize high-resolution nature landscapes. We test the approach on LHQ, LSUN Tower and LSUN Bridge and outperform the baselines by at least 4 times in terms of quality and diversity of the produced infinite images. The project page is located at https://universome.github.io/alis.
updated: Wed Apr 14 2021 16:29:20 GMT+0000 (UTC)
published: Wed Apr 14 2021 16:29:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト