arXiv reaDer
VCE:ワンショット一般化のための変分コンバーター-エンコーダー
VCE: Variational Convertor-Encoder for One-Shot Generalization
変分コンバーター-エンコーダー(VCE)は、画像をさまざまなスタイルに変換します。ワンショットの一般化の問題と、追加のトレーニングなしではこれまで見られなかった新しいタスクへの移行のために、この新しいアーキテクチャを紹介します。また、変分オートエンコーダ(VAE)のパフォーマンスを改善して、私たちが提案した新しいアルゴリズム、つまり大マージンVAE(LMVAE)を使用して、これらのぼやけた点をフィルタリングします。同じプロパティを持つ2つのサンプルがエンコーダーに入力され、エンコーダーのノイズの多い出力からそれらの1つを処理するためにコンバーターが必要です。最後に、ノイズはさまざまな変換規則を表し、新しい画像を変換するために使用されます。条件変分オートエンコーダー(CVAE)と内省的VAEを組み合わせて改善するアルゴリズムであるこの新しいフレームワークは、グラフィックスを生成するのではなく変換することを目的としています。ワンショット生成プロセスに使用されます。トレーニングでは、順次推論アルゴリズムは必要ありません。最近のOmniglotデータセットと比較して、結果は、私たちのモデルがより現実的で多様な画像を生成することを示しています。
Variational Convertor-Encoder (VCE) converts an image to various styles; we present this novel architecture for the problem of one-shot generalization and its transfer to new tasks not seen before without additional training. We also improve the performance of variational auto-encoder (VAE) to filter those blurred points using a novel algorithm proposed by us, namely large margin VAE (LMVAE). Two samples with the same property are input to the encoder, and then a convertor is required to processes one of them from the noisy outputs of the encoder; finally, the noise represents a variety of transformation rules and is used to convert new images. The algorithm that combines and improves the condition variational auto-encoder (CVAE) and introspective VAE, we propose this new framework aim to transform graphics instead of generating them; it is used for the one-shot generative process. No sequential inference algorithmic is needed in training. Compared to recent Omniglot datasets, the results show that our model produces more realistic and diverse images.
updated: Thu Nov 12 2020 07:58:14 GMT+0000 (UTC)
published: Thu Nov 12 2020 07:58:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト