arXiv reaDer
gMADの例からのアクティブな微調整は、ブラインド画像品質評価を改善します
Active Fine-Tuning from gMAD Examples Improves Blind Image Quality Assessment
 画像品質評価(IQA)の研究には長い歴史があり、ディープニューラルネットワーク(DNN)の最近の進歩を活用することで大きな進歩がありました。既存のIQAデータセットの高い相関数にもかかわらず、DNNベースのモデルは、強力な反例が特定されているグループ最大分化(gMAD)競争で簡単に偽造される可能性があります。ここでは、gMADの例を使用してブラインドIQA(BIQA)メソッドを改善できることを示します。具体的には、最初に複数のノイズのあるアノテーターを使用してDNNベースのBIQAモデルを事前トレーニングし、合成的に歪んだ画像の複数のサブジェクト評価データベースで微調整して、最高のベースラインモデルを実現します。次に、ベースラインモデルとgMADの完全参照IQAメソッドのセットを比較して、画像のペアを探します。結果として得られるgMADの例は、ベースラインの相対的な弱点を明らかにし、改良の潜在的な方法を示唆する可能性が最も高くなります。適切に管理されたラボ環境で選択された画像のグラウンドトゥルース品質の注釈を照会し、gMADと既存のデータベースからの人間が評価した画像の組み合わせのベースラインをさらに微調整します。このプロセスを繰り返して、BIQAのgMADの例からアクティブで漸進的な微調整を行うことができます。大規模なラベルなしの画像セットでのアクティブな学習スキームの実行可能性を実証し、微調整された方法により、以前にトレーニングされたデータベースのパフォーマンスを損なうことなく、gMADの一般化可能性が向上することを示します。
The research in image quality assessment (IQA) has a long history, and significant progress has been made by leveraging recent advances in deep neural networks (DNNs). Despite high correlation numbers on existing IQA datasets, DNN-based models may be easily falsified in the group maximum differentiation (gMAD) competition with strong counterexamples being identified. Here we show that gMAD examples can be used to improve blind IQA (BIQA) methods. Specifically, we first pre-train a DNN-based BIQA model using multiple noisy annotators, and fine-tune it on multiple subject-rated databases of synthetically distorted images, resulting in a top-performing baseline model. We then seek pairs of images by comparing the baseline model with a set of full-reference IQA methods in gMAD. The resulting gMAD examples are most likely to reveal the relative weaknesses of the baseline, and suggest potential ways for refinement. We query ground truth quality annotations for the selected images in a well controlled laboratory environment, and further fine-tune the baseline on the combination of human-rated images from gMAD and existing databases. This process may be iterated, enabling active and progressive fine-tuning from gMAD examples for BIQA. We demonstrate the feasibility of our active learning scheme on a large-scale unlabeled image set, and show that the fine-tuned method achieves improved generalizability in gMAD, without destroying performance on previously trained databases.
updated: Thu Apr 08 2021 10:45:16 GMT+0000 (UTC)
published: Sun Mar 08 2020 21:19:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト