拡散モデルはGANよりも高品質の画像を生成する大きな可能性を示していますが、サンプリング速度が遅いため、実際の幅広いアプリケーションが妨げられています。したがって、プログレッシブ蒸留は、N ステップの教師サンプラーの出力画像を N/2 ステップの生徒サンプラーと段階的に整列させることによる高速サンプリングのために提案されています。この論文では、この蒸留ベースの加速方法は、特に数ステップのサンプラーの場合、提案された分類器ベースの機能蒸留 (CFD) を使用してさらに改善できると主張します。出力画像を整列させる代わりに、データセットに依存しない分類器を使用して、教師のシャープな特徴分布を生徒に抽出し、生徒がそれらの重要な特徴に集中してパフォーマンスを向上させるようにします。また、モデルをさらに最適化するために、データセット指向の損失を導入します。 CIFAR-10 での実験は、高品質で高速なサンプリングを達成する上で、私たちの方法の優位性を示しています。コードは近日公開予定です。
Although diffusion model has shown great potential for generating higher quality images than GANs, slow sampling speed hinders its wide application in practice. Progressive distillation is thus proposed for fast sampling by progressively aligning output images of N-step teacher sampler with N/2-step student sampler. In this paper, we argue that this distillation-based accelerating method can be further improved, especially for few-step samplers, with our proposed Classifier-based Feature Distillation (CFD). Instead of aligning output images, we distill teacher's sharpened feature distribution into the student with a dataset-independent classifier, making the student focus on those important features to improve performance. We also introduce a dataset-oriented loss to further optimize the model. Experiments on CIFAR-10 show the superiority of our method in achieving high quality and fast sampling. Code will be released soon.