arXiv reaDer
ブーストされたトリプレット比較による主観的な画質評価
Subjective Image Quality Assessment with Boosted Triplet Comparisons
主観的な完全参照画像品質評価では、参照画像とその歪んだバージョンの知覚画像品質の違いが評価され、多くの場合、劣化カテゴリ評価(DCR)が使用されます。ただし、この順序尺度での評価カテゴリ間の違いは知覚的に等距離ではない可能性があり、オブザーバーはカテゴリについて異なる理解を持っている可能性があるため、DCRは批判されています。歪んだ画像のペア比較(PC)と、それに続くスケール値のサーストニアン再構成により、これらの問題が克服されます。さらに、PCはDCRよりも感度が高く、正確な知覚的解釈を表す分数の丁度可知差異(JND)単位でスケール値を提供できます。それでも、ほぼ同じ品質の画像の比較は難しい場合があります。感度をさらに高める、より一般的なトリプレット比較(TC)に組み込まれたブースティング手法を紹介します。ブーストは、歪んだ画像のアーティファクトを増幅したり、ズームによって視覚的表現を拡大したり、ちらつき効果によって歪んだ画像の視認性を高めたり、または上記のいくつかを組み合わせたりします。実験結果は、7種類の歪みに対するブーストTCの有効性を示しています。トリプレットの質問に対する170万を超える回答をクラウドソーシングしました。詳細な分析によると、ブーストすると識別力が高まり、結果として得られる相対的な画質値の精度を犠牲にすることなく、主観的な評価の数を減らすことができます。私たちの技術は、よりきめ細かい画質データセットへの道を開き、より多くの歪みレベルを可能にしますが、高品質の主観的な注釈を備えています。また、TCと注釈付きデータセットKonFiG-IQAからのサーストニアンスケール再構成の詳細を提供します。これには、3 JNDユニットのスパンにわたって等間隔で、12または30レベルの7つの歪みタイプを使用して処理された10個のソース画像が含まれます。
In subjective full-reference image quality assessment, differences between perceptual image qualities of the reference image and its distorted versions are evaluated, often using degradation category ratings (DCR). However, the DCR has been criticized since differences between rating categories on this ordinal scale might not be perceptually equidistant, and observers may have different understandings of the categories. Pair comparisons (PC) of distorted images, followed by Thurstonian reconstruction of scale values, overcome these problems. In addition, PC is more sensitive than DCR, and it can provide scale values in fractional, just noticeable difference (JND) units that express a precise perceptional interpretation. Still, the comparison of images of nearly the same quality can be difficult. We introduce boosting techniques embedded in more general triplet comparisons (TC) that increase the sensitivity even more. Boosting amplifies the artefacts of distorted images, enlarges their visual representation by zooming, increases the visibility of the distortions by a flickering effect, or combines some of the above. Experimental results show the effectiveness of boosted TC for seven types of distortion. We crowdsourced over 1.7 million responses to triplet questions. A detailed analysis shows that boosting increases the discriminatory power and allows to reduce the number of subjective ratings without sacrificing the accuracy of the resulting relative image quality values. Our technique paves the way to fine-grained image quality datasets, allowing for more distortion levels, yet with high-quality subjective annotations. We also provide the details for Thurstonian scale reconstruction from TC and our annotated dataset, KonFiG-IQA, containing 10 source images, processed using 7 distortion types at 12 or even 30 levels, uniformly spaced over a span of 3 JND units.
updated: Sat Jul 31 2021 10:03:32 GMT+0000 (UTC)
published: Sat Jul 31 2021 10:03:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト