データ駆動型の生成モデリングは、ディープニューラルネットワークの力を活用することで目覚しい進歩を遂げています。繰り返し発生する課題は、モデルがトレーニングデータに限定された分布からではなく、ターゲット分布全体から豊富なサンプルを生成できるようにする方法です。言い換えれば、生成モデルが観察されたサンプルを超えて、「見えない」がまだもっともらしいデータを生成することを学ぶことを望んでいます。私たちの仕事では、部品ベースの事前に基づいた2Dまたは3D形状の生成ニューラルネットワークであるCompoNetを紹介します。主要なアイデアは、形状部品とその構成の両方を変更して形状を合成することです。形状を構造化されていない全体としてではなく、変形可能な部品の(再)構成可能なセットとして扱うことにより、生成プロセスに組み合わせの次元が追加され、出力の多様性が豊かになり、ジェネレーターが「見えない」部分にさらに踏み込むようになります'。パーツベースのモデルは、ベースラインの生成モデルと比較して、より多様なもっともらしい形状を生成することを示します。この目的のために、生成モデルの多様性を評価し、生成されたデータが同じターゲット分布からのトレーニングデータと不可視データの両方をどれだけカバーしているかを評価する2つの定量的メトリックを導入します。コードはhttps://github.com/nschor/CompoNetで入手できます。
Data-driven generative modeling has made remarkable progress by leveraging the power of deep neural networks. A reoccurring challenge is how to enable a model to generate a rich variety of samples from the entire target distribution, rather than only from a distribution confined to the training data. In other words, we would like the generative model to go beyond the observed samples and learn to generate ``unseen'', yet still plausible, data. In our work, we present CompoNet, a generative neural network for 2D or 3D shapes that is based on a part-based prior, where the key idea is for the network to synthesize shapes by varying both the shape parts and their compositions. Treating a shape not as an unstructured whole, but as a (re-)composable set of deformable parts, adds a combinatorial dimension to the generative process to enrich the diversity of the output, encouraging the generator to venture more into the ``unseen''. We show that our part-based model generates richer variety of plausible shapes compared with baseline generative models. To this end, we introduce two quantitative metrics to evaluate the diversity of a generative model and assess how well the generated data covers both the training data and unseen data from the same target distribution. Code is available at https://github.com/nschor/CompoNet.