arXiv reaDer
深い生成モデルを使用したベイジアン画像再構成
Bayesian Image Reconstruction using Deep Generative Models
機械学習モデルは通常、ペアの(入力、出力)データを使用して、エンドツーエンドで監視された設定でトレーニングされます。古典的な例には、(低解像度、高解像度)画像のペアでトレーニングする最近の超解像法が含まれます。ただし、これらのエンドツーエンドのアプローチでは、入力(たとえば、夜の画像と日光)または関連する潜在変数(たとえば、カメラのぼけや手の動き)に分布の変化があるたびに、再トレーニングが必要です。この作業では、最先端の(SOTA)生成モデル(ここではStyleGAN2)を活用して、強力な画像事前分布を構築します。これにより、ベイズの定理を多くのダウンストリーム再構成タスクに適用できます。生成モデルによるベイズ再構成(BRGM)と呼ばれる私たちの方法は、事前にトレーニングされた単一のジェネレータモデルを使用して、さまざまな前方破損モデルと組み合わせることにより、さまざまな画像復元タスク、つまり超解像とインペインティングを解決します。強力な事前情報を構築できる3つの大規模で多様なデータセットでBRGMを示します:(i)Flick Faces高品質データセットからの60,000枚の画像karras2019style(ii)MIMIC IIIからの240,000枚の胸部X線および(iii)組み合わせたコレクション7,329スキャンの5つの脳MRIデータセットの。 3つのデータセットすべてにわたって、データセット固有のハイパーパラメータ調整なしで、私たちのアプローチは、最先端と比較して、特に低解像度レベルでの超解像と修復で最先端のパフォーマンスをもたらします各再構築タスクに固有のメソッド。コードと事前トレーニング済みモデルをオンラインで利用できるようにします。
Machine learning models are commonly trained end-to-end and in a supervised setting, using paired (input, output) data. Classical examples include recent super-resolution methods that train on pairs of (low-resolution, high-resolution) images. However, these end-to-end approaches require re-training every time there is a distribution shift in the inputs (e.g., night images vs daylight) or relevant latent variables (e.g., camera blur or hand motion). In this work, we leverage state-of-the-art (SOTA) generative models (here StyleGAN2) for building powerful image priors, which enable application of Bayes' theorem for many downstream reconstruction tasks. Our method, called Bayesian Reconstruction through Generative Models (BRGM), uses a single pre-trained generator model to solve different image restoration tasks, i.e., super-resolution and in-painting, by combining it with different forward corruption models. We demonstrate BRGM on three large, yet diverse, datasets that enable us to build powerful priors: (i) 60,000 images from the Flick Faces High Quality dataset karras2019style (ii) 240,000 chest X-rays from MIMIC III and (iii) a combined collection of 5 brain MRI datasets with 7,329 scans. Across all three datasets and without any dataset-specific hyperparameter tuning, our approach yields state-of-the-art performance on super-resolution, particularly at low-resolution levels, as well as inpainting, compared to state-of-the-art methods that are specific to each reconstruction task. We will make our code and pre-trained models available online.
updated: Tue Dec 08 2020 17:11:26 GMT+0000 (UTC)
published: Tue Dec 08 2020 17:11:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト