KonIQ-10k: An ecologically valid database for deep learning of blind image quality assessment
 既存のデータセットのサイズが小さいため、画質評価(IQA)の深層学習手法は制限されています。広範なデータセットには、発行可能なコンテンツを生成し、正確に注釈を付けるために、かなりのリソースが必要です。現在までに最大のIQAデータセットであるKonIQ-10kを作成するための体系的でスケーラブルなアプローチを紹介します。これは、歪みの信頼性、コンテンツの多様性、および品質関連の指標に関する、生態学的妥当性を目的とした最初の実際のデータベースです。クラウドソーシングを使用することにより、1,459人のクラウドワーカーから120万件の信頼できる品質評価を取得し、より一般的なIQAモデルへの道を開きました。小説のディープラーニングモデル(KonCept512)を提案し、テストセット(0.921 SROCC)を超えた優れた一般化を、最新のデータベースLIVE-in-the-Wild(0.825 SROCC)に示します。このモデルのコアパフォーマンスは、InceptionResNetアーキテクチャから派生しており、以前のモデル(512x384)よりも高い解像度でトレーニングされています。相関分析は、KonCept512が各テスト画像に対して9つの主観的スコアを持つのと同様に機能することを示しています。
Deep learning methods for image quality assessment (IQA) are limited due to the small size of existing datasets. Extensive datasets require substantial resources both for generating publishable content and annotating it accurately. We present a systematic and scalable approach to creating KonIQ-10k, the largest IQA dataset to date, consisting of 10,073 quality scored images. It is the first in-the-wild database aiming for ecological validity, concerning the authenticity of distortions, the diversity of content, and quality-related indicators. Through the use of crowdsourcing, we obtained 1.2 million reliable quality ratings from 1,459 crowd workers, paving the way for more general IQA models. We propose a novel, deep learning model (KonCept512), to show an excellent generalization beyond the test set (0.921 SROCC), to the current state-of-the-art database LIVE-in-the-Wild (0.825 SROCC). The model derives its core performance from the InceptionResNet architecture, being trained at a higher resolution than previous models (512x384). Correlation analysis shows that KonCept512 performs similar to having 9 subjective scores for each test image.
updated: Wed May 27 2020 09:40:51 GMT+0000 (UTC)
published: Mon Oct 14 2019 14:38:48 GMT+0000 (UTC)
