arXiv reaDer
条件付き生成的敵対的ネットワークから高品質の画像を生成するための効率的なサブサンプリング
Efficient Subsampling for Generating High-Quality Images from Conditional Generative Adversarial Networks
全体的な画質を改善するために無条件の生成的敵対的ネットワーク(GAN)をサブサンプリングすることが最近研究されています。ただし、これらの方法は多くの場合、高いトレーニングコスト(ストレージスペース、パラメータチューニングなど)を必要とし、条件に多くの異なる条件がある場合、クラス条件付きGANや連続条件付きGAN(CcGAN)などの条件付きGANのサブサンプリングには非効率的または適用できない場合があります。値。本論文では、条件付きソフトプラス損失を伴う特徴空間における条件付き密度比推定(cDRE-F-cSP)と呼ばれる効率的な方法を提案した。 cDRE-F-cSPを使用して、特別に設計されたResNet-34またはスパースオートエンコーダーによって学習された特徴空間での新しい条件付きSoftplus(cSP)損失に基づいて、画像の条件付き密度比を推定します。次に、提案されたcSP損失でトレーニングされた条件付き密度比モデルの誤差限界を導き出します。最後に、クラス条件付きGANとCcGANの両方を効率的にサブサンプリングできるcDRE-F-cSP + RSと呼ばれる棄却サンプリングスキームを提案します。ラベルの一貫性を高めるために、CcGAN用に追加のフィルタリングスキームも開発されています。 CIFAR-10およびTiny-ImageNetデータセットでの実験は、cDRE-F-cSP + RSがBigGANのIntra-FIDおよびFIDスコアを大幅に改善できることを示しています。 RC-49およびUTKFaceデータセットでの実験は、cDRE-F-cSP + RSがCcGANのFID内、多様性、およびラベルスコアも改善することを示しています。さらに、cDRE-F-cSP + RSの高効率を示すために、最先端の無条件サブサンプリング法(つまり、DRE-F-SP + RS)と比較します。同等またはそれ以上のパフォーマンスを備えたcDRE-F-cSP + RSは、DRE-F-SP + RSによってCIFAR-10およびUTKFaceにそれぞれ費やされるトレーニングコストの約10%および1.7%しか必要としません。
Subsampling unconditional generative adversarial networks (GANs) to improve the overall image quality has been studied recently. However, these methods often require high training costs (e.g., storage space, parameter tuning) and may be inefficient or even inapplicable for subsampling conditional GANs, such as class-conditional GANs and continuous conditional GANs (CcGANs), when the condition has many distinct values. In this paper, we propose an efficient method called conditional density ratio estimation in feature space with conditional Softplus loss (cDRE-F-cSP). With cDRE-F-cSP, we estimate an image's conditional density ratio based on a novel conditional Softplus (cSP) loss in the feature space learned by a specially designed ResNet-34 or sparse autoencoder. We then derive the error bound of a conditional density ratio model trained with the proposed cSP loss. Finally, we propose a rejection sampling scheme, termed cDRE-F-cSP+RS, which can subsample both class-conditional GANs and CcGANs efficiently. An extra filtering scheme is also developed for CcGANs to increase the label consistency. Experiments on CIFAR-10 and Tiny-ImageNet datasets show that cDRE-F-cSP+RS can substantially improve the Intra-FID and FID scores of BigGAN. Experiments on RC-49 and UTKFace datasets demonstrate that cDRE-F-cSP+RS also improves Intra-FID, Diversity, and Label Score of CcGANs. Moreover, to show the high efficiency of cDRE-F-cSP+RS, we compare it with the state-of-the-art unconditional subsampling method (i.e., DRE-F-SP+RS). With comparable or even better performance, cDRE-F-cSP+RS only requires about 10% and 1.7% of the training costs spent respectively on CIFAR-10 and UTKFace by DRE-F-SP+RS.
updated: Sat Mar 20 2021 12:19:18 GMT+0000 (UTC)
published: Sat Mar 20 2021 12:19:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト