arXiv reaDer
(ASNA)知覚的画質評価のための代理ランキング損失関数を備えた注意ベースのシャム差分ニューラルネットワーク
(ASNA) An Attention-based Siamese-Difference Neural Network with Surrogate Ranking Loss function for Perceptual Image Quality Assessment
最近、画像の復元と強調のために敵対的なトレーニングフレームワークを活用する深い畳み込みニューラルネットワーク(DCNN)により、処理された画像の鮮明さが大幅に向上しました。驚いたことに、これらのDCNNは視覚的に他の方法よりも鮮明な画像を生成しましたが、それらを評価するために一般的な方法を採用すると、品質スコアが低くなる可能性があります。したがって、それらのパフォーマンスを反映するための定量的メトリックを開発する必要があります。これは、画像の知覚品質とよく一致しています。ピーク信号対雑音比(PSNR)、構造類似性指数測定(SSIM)、知覚指数(PI)などの有名な定量的指標は、特に画像の平均オピニオン評点(MOS)とはあまり相関していません。敵対損失関数で訓練されたニューラルネットワーク。この論文では、従来のシャムネットワークの拡張アーキテクチャ、いわゆるシャム差分ニューラルネットワークを使用した畳み込みニューラルネットワークを提案しました。このアーキテクチャには、メソッドのパフォーマンスを向上させるために、空間的およびチャネルごとの注意メカニズムが装備されています。最後に、補助損失関数を使用してモデルをトレーニングしました。提案された追加のコスト関数は、ニューラルネットワークパラメーターに関して微分可能である一方で、スピアマンの順位相関係数を増加させるために順位損失を代理します。私たちの方法は、NTIRE2021知覚画質評価チャレンジで優れたパフォーマンスを達成しました。提案された方法の実装は公開されています。
Recently, deep convolutional neural networks (DCNN) that leverage the adversarial training framework for image restoration and enhancement have significantly improved the processed images' sharpness. Surprisingly, although these DCNNs produced crispier images than other methods visually, they may get a lower quality score when popular measures are employed for evaluating them. Therefore it is necessary to develop a quantitative metric to reflect their performances, which is well-aligned with the perceived quality of an image. Famous quantitative metrics such as Peak signal-to-noise ratio (PSNR), The structural similarity index measure (SSIM), and Perceptual Index (PI) are not well-correlated with the mean opinion score (MOS) for an image, especially for the neural networks trained with adversarial loss functions. This paper has proposed a convolutional neural network using an extension architecture of the traditional Siamese network so-called Siamese-Difference neural network. We have equipped this architecture with the spatial and channel-wise attention mechanism to increase our method's performance. Finally, we employed an auxiliary loss function to train our model. The suggested additional cost function surrogates ranking loss to increase Spearman's rank correlation coefficient while it is differentiable concerning the neural network parameters. Our method achieved superior performance in NTIRE 2021 Perceptual Image Quality Assessment Challenge. The implementations of our proposed method are publicly available.
updated: Thu May 06 2021 09:04:21 GMT+0000 (UTC)
published: Thu May 06 2021 09:04:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト