Wavelet Transform-assisted Adaptive Generative Modeling for Colorization
教師なしディープ ラーニングは、高品質のサンプルを生成できる可能性があることを最近実証しました。画像のカラー化タスクを促進する大きな可能性を秘めていますが、データマニホールドとモデル機能の次元が高いため、パフォーマンスは制限されています。この研究では、ウェーブレット ドメインでスコアベースの生成モデルを利用して問題に対処する新しいスキームを提示します。ウェーブレット変換によるマルチスケールおよびマルチチャネル表現を利用することにより、提案されたモデルは、積み重ねられた粗いおよび詳細なウェーブレット係数コンポーネントからより豊富な事前確率を共同かつ効果的に学習します。この戦略はまた、元の多様体の次元を削減し、次元の呪いを軽減します。これは、推定とサンプリングに役立ちます。さらに、ウェーブレット ドメインの二重の一貫性の項、つまりデータの一貫性と構造の一貫性は、カラー化タスクをより効果的に活用するために考案されています。具体的には、トレーニング フェーズでは、ウェーブレット係数で構成されるマルチチャネル テンソルのセットを入力として使用して、ノイズ除去スコア マッチングを使用してネットワークをトレーニングします。推論フェーズでは、データと構造の一貫性を備えたアニールされたランジュバン ダイナミクスを介して、サンプルが繰り返し生成されます。実験では、生成とカラー化の両方の品質、特にカラー化の堅牢性と多様性において、提案された方法の顕著な改善が実証されました。
Unsupervised deep learning has recently demonstrated the promise of producing high-quality samples. While it has tremendous potential to promote the image colorization task, the performance is limited owing to the high-dimension of data manifold and model capability. This study presents a novel scheme that exploits the score-based generative model in wavelet domain to address the issues. By taking advantage of the multi-scale and multi-channel representation via wavelet transform, the proposed model learns the richer priors from stacked coarse and detailed wavelet coefficient components jointly and effectively. This strategy also reduces the dimension of the original manifold and alleviates the curse of dimensionality, which is beneficial for estimation and sampling. Moreover, dual consistency terms in the wavelet domain, namely data-consistency and structure-consistency are devised to leverage colorization task better. Specifically, in the training phase, a set of multi-channel tensors consisting of wavelet coefficients is used as the input to train the network with denoising score matching. In the inference phase, samples are iteratively generated via annealed Langevin dynamics with data and structure consistencies. Experiments demonstrated remarkable improvements of the proposed method on both generation and colorization quality, particularly in colorization robustness and diversity.
updated: Thu Aug 18 2022 06:05:18 GMT+0000 (UTC)
published: Fri Jul 09 2021 07:12:39 GMT+0000 (UTC)
