フローベースの生成モデルは、最近、モデル データ生成の最も効率的なアプローチの 1 つになりました。実際、それらは一連の可逆的で扱いやすい変換で構成されています。 Glow は、可逆 1 ×1 畳み込みを使用した単純なタイプの生成フローを最初に導入しました。ただし、1 × 1 畳み込みは、標準の畳み込みに比べて柔軟性が限られています。この論文では、可逆な1×1畳み込みの制限を克服する、新しい可逆なn×n畳み込みアプローチを提案します。さらに、提案されたネットワークは、扱いやすく可逆であるだけでなく、標準の畳み込みよりも少ないパラメーターを使用します。 CIFAR-10、ImageNet、および Celeb-HQ データセットでの実験では、可逆な n ×n 畳み込みが生成モデルのパフォーマンスを大幅に改善するのに役立つことが示されました。
Flow-based generative models have recently become one of the most efficient approaches to model data generation. Indeed, they are constructed with a sequence of invertible and tractable transformations. Glow first introduced a simple type of generative flow using an invertible 1 ×1 convolution. However, the 1 ×1 convolution suffers from limited flexibility compared to the standard convolutions. In this paper, we propose a novel invertible n ×n convolution approach that overcomes the limitations of the invertible 1 ×1 convolution. In addition, our proposed network is not only tractable and invertible but also uses fewer parameters than standard convolutions. The experiments on CIFAR-10, ImageNet and Celeb-HQ datasets, have shown that our invertible n ×n convolution helps to improve the performance of generative models significantly.