arXiv reaDer
動的デュアル出力拡散モデル
Dynamic Dual-Output Diffusion Models
ノイズ除去拡散モデルとしても知られる反復ノイズ除去ベースの生成は、最近、他のクラスの生成モデルと品質が同等であり、それらを超えることが示されています。特に、画像生成の多くのサブタスクで現在最先端の生成的敵対的ネットワークを含みます。ただし、この方法の主な欠点は、競争力のある結果を生成するために数百回の反復が必要になることです。最近の研究では、より少ない反復でより高速な生成を可能にするソリューションが提案されていますが、生成中に適用される反復がますます少なくなると、画質は徐々に低下します。このホワイトペーパーでは、拡散モデルの生成品質に影響を与えるいくつかの原因を明らかにし、特に数回の反復でサンプリングする場合に、それらを軽減するためのシンプルで効果的なソリューションを考え出します。反復ノイズ除去について2つの反対の方程式を検討します。最初の方程式は適用されるノイズを予測し、2番目の方程式は画像を直接予測します。私たちのソリューションは2つのオプションを採用し、ノイズ除去プロセスを通じてそれらを動的に切り替えることを学習します。提案するソリューションは一般的であり、既存の拡散モデルに適用できます。示したように、さまざまなSOTAアーキテクチャに適用すると、私たちのソリューションは、複雑さとパラメータの追加を無視して、生成品質を即座に向上させます。複数のデータセットと構成を実験し、これらの調査結果をサポートするために広範なアブレーション調査を実行します。
Iterative denoising-based generation, also known as denoising diffusion models, has recently been shown to be comparable in quality to other classes of generative models, and even surpass them. Including, in particular, Generative Adversarial Networks, which are currently the state of the art in many sub-tasks of image generation. However, a major drawback of this method is that it requires hundreds of iterations to produce a competitive result. Recent works have proposed solutions that allow for faster generation with fewer iterations, but the image quality gradually deteriorates with increasingly fewer iterations being applied during generation. In this paper, we reveal some of the causes that affect the generation quality of diffusion models, especially when sampling with few iterations, and come up with a simple, yet effective, solution to mitigate them. We consider two opposite equations for the iterative denoising, the first predicts the applied noise, and the second predicts the image directly. Our solution takes the two options and learns to dynamically alternate between them through the denoising process. Our proposed solution is general and can be applied to any existing diffusion model. As we show, when applied to various SOTA architectures, our solution immediately improves their generation quality, with negligible added complexity and parameters. We experiment on multiple datasets and configurations and run an extensive ablation study to support these findings.
updated: Tue Mar 15 2022 10:11:01 GMT+0000 (UTC)
published: Tue Mar 08 2022 11:20:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト