arXiv reaDer
パレット:画像から画像への拡散モデル
Palette: Image-to-Image Diffusion Models
このペーパーでは、条件付き拡散モデルに基づく画像から画像への変換のための統一されたフレームワークを開発し、4つの難しい画像から画像への変換タスク、つまり、カラー化、修復、トリミング解除、およびJPEG復元でこのフレームワークを評価します。画像から画像への拡散モデルの単純な実装は、タスク固有のハイパーパラメータの調整、アーキテクチャのカスタマイズ、補助的な損失や高度な新しい技術を必要とせずに、すべてのタスクで強力なGANおよび回帰ベースラインを上回ります。ノイズ除去拡散目標におけるL2対L1損失がサンプルの多様性に与える影響を明らかにし、経験的研究を通じて神経構造における自己注意の重要性を示します。重要なのは、人間の評価とサンプル品質スコア(FID、開始スコア、事前トレーニング済みResNet-50の分類精度、および元の画像に対する知覚距離)を使用して、ImageNetに基づく統一された評価プロトコルを提唱することです。この標準化された評価プロトコルが、画像から画像へのトランスレーショナルリサーチを進める上で役割を果たすことを期待しています。最後に、ジェネラリストのマルチタスク拡散モデルが、タスク固有のスペシャリストのモデルと同等またはそれ以上のパフォーマンスを発揮することを示します。結果の概要については、https://diffusion-palette.github.ioを確認してください。
This paper develops a unified framework for image-to-image translation based on conditional diffusion models and evaluates this framework on four challenging image-to-image translation tasks, namely colorization, inpainting, uncropping, and JPEG restoration. Our simple implementation of image-to-image diffusion models outperforms strong GAN and regression baselines on all tasks, without task-specific hyper-parameter tuning, architecture customization, or any auxiliary loss or sophisticated new techniques needed. We uncover the impact of an L2 vs. L1 loss in the denoising diffusion objective on sample diversity, and demonstrate the importance of self-attention in the neural architecture through empirical studies. Importantly, we advocate a unified evaluation protocol based on ImageNet, with human evaluation and sample quality scores (FID, Inception Score, Classification Accuracy of a pre-trained ResNet-50, and Perceptual Distance against original images). We expect this standardized evaluation protocol to play a role in advancing image-to-image translation research. Finally, we show that a generalist, multi-task diffusion model performs as well or better than task-specific specialist counterparts. Check out https://diffusion-palette.github.io for an overview of the results.
updated: Tue May 03 2022 22:24:28 GMT+0000 (UTC)
published: Wed Nov 10 2021 17:49:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト