arXiv reaDer
視覚言語対応による盲目の画質評価:マルチタスク学習の視点
Blind Image Quality Assessment via Vision-Language Correspondence: A Multitask Learning Perspective
私たちは、参照情報なしで人間の画質の知覚を予測するブラインド画質評価 (BIQA) の進歩を目指しています。モデル パラメーターの共有と損失の重み付けが自動的に決定されるように、BIQA が他のタスクから補助的な知識を活用するための一般的で自動化されたマルチタスク学習スキームを開発します。具体的には、最初にテキスト テンプレートを使用して (複数のタスクからの) すべての候補ラベルの組み合わせを記述し、視覚テキスト埋め込みのコサイン類似度から結合確率を計算します。各タスクの予測は、結合分布から推測でき、慎重に設計された損失関数によって最適化されます。 BIQA、シーン分類、および歪みタイプ識別の 3 つのタスクを学習するための包括的な実験を通じて、提案された BIQA 手法 1) がシーン分類および歪みタイプ識別タスクの恩恵を受け、複数の IQA で最先端の技術よりも優れていることを確認します。データセット、2) グループ最大差別化競争でより堅牢であり、3) 異なる IQA データセットからの品質注釈をより効果的に再調整します。ソース コードは https://github.com/zwx8981/LIQE で入手できます。
We aim at advancing blind image quality assessment (BIQA), which predicts the human perception of image quality without any reference information. We develop a general and automated multitask learning scheme for BIQA to exploit auxiliary knowledge from other tasks, in a way that the model parameter sharing and the loss weighting are determined automatically. Specifically, we first describe all candidate label combinations (from multiple tasks) using a textual template, and compute the joint probability from the cosine similarities of the visual-textual embeddings. Predictions of each task can be inferred from the joint distribution, and optimized by carefully designed loss functions. Through comprehensive experiments on learning three tasks - BIQA, scene classification, and distortion type identification, we verify that the proposed BIQA method 1) benefits from the scene classification and distortion type identification tasks and outperforms the state-of-the-art on multiple IQA datasets, 2) is more robust in the group maximum differentiation competition, and 3) realigns the quality annotations from different IQA datasets more effectively. The source code is available at https://github.com/zwx8981/LIQE.
updated: Mon Mar 27 2023 07:58:09 GMT+0000 (UTC)
published: Mon Mar 27 2023 07:58:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト