超解像(SR)は、近年広く研究されているトピックになっています。 SRメソッドは、全体的な画像とビデオの品質を向上させ、さらなるコンテンツ分析の新しい可能性を生み出すことができます。しかし、SRの主流は、コンテキストの精度を失う可能性があるにもかかわらず、主に結果の画像の自然さを高めることに焦点を当てています。このような方法では、優れた視覚的品質が得られたとしても、誤った数字、文字、顔、またはその他の構造オブジェクトが生成される可能性があります。詳細の復元が正しくないと、オブジェクトを手動と自動の両方で検出および識別するときにエラーが発生する可能性があります。画像およびビデオSRモデルの詳細復元機能を分析するために、SRモデルが通常正しく復元できない複雑なパターンを含む独自のビデオデータセットに基づいてベンチマークを開発しました。ベンチマークを使用して32の最近のSRモデルを評価し、シーンコンテキストを保持する能力を比較しました。また、復元された詳細のクラウドソーシングによる比較を実施し、このタスクの主観的なスコアとの相関関係によって他の品質メトリックを上回る客観的な評価メトリックを開発しました。結論として、将来のSRベースの作業に関する洞察をもたらすベンチマーク結果の詳細な分析を提供します。
Super-resolution (SR) has become a widely researched topic in recent years. SR methods can improve overall image and video quality and create new possibilities for further content analysis. But the SR mainstream focuses primarily on increasing the naturalness of the resulting image despite potentially losing context accuracy. Such methods may produce an incorrect digit, character, face, or other structural object even though they otherwise yield good visual quality. Incorrect detail restoration can cause errors when detecting and identifying objects both manually and automatically. To analyze the detail-restoration capabilities of image and video SR models, we developed a benchmark based on our own video dataset, which contains complex patterns that SR models generally fail to correctly restore. We assessed 32 recent SR models using our benchmark and compared their ability to preserve scene context. We also conducted a crowd-sourced comparison of restored details and developed an objective assessment metric that outperforms other quality metrics by correlation with subjective scores for this task. In conclusion, we provide a deep analysis of benchmark results that yields insights for future SR-based work.