arXiv reaDer
ワトソンの知覚モデルに基づく生成ニューラルネットワークの損失関数
A Loss Function for Generative Neural Networks Based on Watson's Perceptual Model
Variational Autoencoders(VAE)をトレーニングしてリアルな画像を生成するには、画像の類似性に対する人間の認識を反映する損失関数が必要です。周波数空間で重み付き距離を計算し、輝度とコントラストのマスキングを説明するワトソンの知覚モデルに基づいて、このような損失関数を提案します。モデルをカラー画像に拡張し、フーリエ変換を使用して変換のロバスト性を高め、画像をブロックに分割することによるアーティファクトを取り除き、区別可能にします。実験では、新しい損失関数で訓練されたVAEは、現実的で高品質の画像サンプルを生成しました。ユークリッド距離と構造類似性インデックスを使用する場合と比較して、画像はぼやけが少なかった。ディープニューラルネットワークベースの損失と比較して、新しいアプローチでは、計算リソースが少なくて済み、アーチファクトの少ない画像が生成されました。
To train Variational Autoencoders (VAEs) to generate realistic imagery requires a loss function that reflects human perception of image similarity. We propose such a loss function based on Watson's perceptual model, which computes a weighted distance in frequency space and accounts for luminance and contrast masking. We extend the model to color images, increase its robustness to translation by using the Fourier Transform, remove artifacts due to splitting the image into blocks, and make it differentiable. In experiments, VAEs trained with the new loss function generated realistic, high-quality image samples. Compared to using the Euclidean distance and the Structural Similarity Index, the images were less blurry; compared to deep neural network based losses, the new approach required less computational resources and generated images with less artifacts.
updated: Wed Jan 06 2021 11:16:21 GMT+0000 (UTC)
published: Fri Jun 26 2020 15:36:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト