過去数年間で、ディープラーニングをビジュアルジェネレーションに体系的に採用することで、特に畳み込みアーキテクチャの大規模な調査から確実に恩恵を受ける印象的な結果が得られました。この論文では、学習機能と生成されるターゲットの論理記述を組み合わせたビジュアル生成への一般的なアプローチを提案します。生成のプロセスは、制約がターゲットを特徴付ける一連のプロパティを記述する制約付きの満足度の問題と見なされます。興味深いことに、制約には論理変数も含まれる可能性がありますが、それらのすべてはtノルム理論によって実数値関数に変換されます。ディープアーキテクチャを使用して、関連する変数をモデル化し、学習プロセスが制約の充足を実行する計算スキームを提案します。 GANや自動エンコーダーのモデリングなど、理論が自然に使用できる例をいくつか提案し、手書き文字の生成や顔の変換に関する問題の有望な結果を報告します。
In the last few years the systematic adoption of deep learning to visual generation has produced impressive results that, amongst others, definitely benefit from the massive exploration of convolutional architectures. In this paper, we propose a general approach to visual generation that combines learning capabilities with logic descriptions of the target to be generated. The process of generation is regarded as a constrained satisfaction problem, where the constraints describe a set of properties that characterize the target. Interestingly, the constraints can also involve logic variables, while all of them are converted into real-valued functions by means of the t-norm theory. We use deep architectures to model the involved variables, and propose a computational scheme where the learning process carries out a satisfaction of the constraints. We propose some examples in which the theory can naturally be used, including the modeling of GAN and auto-encoders, and report promising results in problems with the generation of handwritten characters and face transformations.