ユーザーの落書きによる制御可能な画像合成は、コンピューター ビジョン コミュニティで強い関心を集めているトピックです。この論文では、不完全で原始的な人間の絵画からのフォトリアリスティックな画像合成の問題を初めて研究します。特に、不完全な人間の絵画の多様体から現実的なレンダリングへのマッピングを学習することにより、初歩的なブラシストローク入力から「ユーザーが描きたいもの」を予測 (および適応) することを学習する新しいアプローチ paint2pix を提案します。自律ペインティング エージェントの最近の研究と組み合わせて使用すると、paint2pix をゼロからのプログレッシブ イメージ合成に使用できることを示します。このプロセス中、paint2pix を使用すると、合成プロセスの軌道を正確に操るために粗いユーザーの落書きをいくつか行うだけで、初心者ユーザーが目的の画像出力を段階的に合成できます。さらに、私たちのアプローチは実際の画像編集にも驚くほど便利なアプローチを形成し、適切に配置された数本のブラシストロークを追加するだけで、ユーザーがさまざまな範囲のカスタムのきめ細かい編集を実行できることがわかりました。補足ビデオとデモは、https://1jsingh.github.io/paint2pix で入手できます。
Controllable image synthesis with user scribbles is a topic of keen interest in the computer vision community. In this paper, for the first time we study the problem of photorealistic image synthesis from incomplete and primitive human paintings. In particular, we propose a novel approach paint2pix, which learns to predict (and adapt) "what a user wants to draw" from rudimentary brushstroke inputs, by learning a mapping from the manifold of incomplete human paintings to their realistic renderings. When used in conjunction with recent works in autonomous painting agents, we show that paint2pix can be used for progressive image synthesis from scratch. During this process, paint2pix allows a novice user to progressively synthesize the desired image output, while requiring just few coarse user scribbles to accurately steer the trajectory of the synthesis process. Furthermore, we find that our approach also forms a surprisingly convenient approach for real image editing, and allows the user to perform a diverse range of custom fine-grained edits through the addition of only a few well-placed brushstrokes. Supplemental video and demo are available at https://1jsingh.github.io/paint2pix