arXiv reaDer
D2C-SR:画像の超解像のための発散から収束へのアプローチ
D2C-SR: A Divergence to Convergence Approach for Image Super-Resolution
この論文では、画像超解像(SR)のタスクのための新しいフレームワークであるD2C-SRを紹介します。不適切な問題として、超解像関連タスクの主な課題は、特定の低解像度入力に対して複数の予測が存在する可能性があることです。ほとんどの古典的な方法と初期の深層学習ベースのアプローチは、この基本的な事実を無視し、この問題を決定論的な処理としてモデル化しました。これは、しばしば不十分な結果につながります。 SRFlowのような最近の研究に触発されて、この問題に半確率的に取り組み、2段階のパイプラインを提案します。発散段階は、離散形式で基礎となる高解像度出力の分布を学習するために使用され、収束段階は続いて、学習した予測を最終出力に融合します。より具体的には、ツリーベースの構造のディープネットワークを提案します。このネットワークでは、各ブランチが可能な高解像度の予測を学習するように設計されています。発散段階では、各ブランチはグラウンドトゥルースに合うように個別にトレーニングされ、トリプルロスは異なるブランチからの出力を発散させるために使用されます。続いて、最初のステージからの出力が最適ではない可能性があるため、複数の予測を組み合わせるためにヒューズモジュールを追加します。ヒューズモジュールは、エンドツーエンドの方法で最終的な高解像度画像に収束するようにトレーニングできます。 8倍のアップスケーリング係数を持つ新しい提案されたデータセットを含むいくつかのベンチマークで評価を行います。私たちの実験は、D2C-SRがPSNRとSSIMで最先端のパフォーマンスを大幅に少ない計算コストで達成できることを示しています。
In this paper, we present D2C-SR, a novel framework for the task of image super-resolution(SR). As an ill-posed problem, the key challenge for super-resolution related tasks is there can be multiple predictions for a given low-resolution input. Most classical methods and early deep learning based approaches ignored this fundamental fact and modeled this problem as a deterministic processing which often lead to unsatisfactory results. Inspired by recent works like SRFlow, we tackle this problem in a semi-probabilistic manner and propose a two-stage pipeline: a divergence stage is used to learn the distribution of underlying high-resolution outputs in a discrete form, and a convergence stage is followed to fuse the learned predictions into a final output. More specifically, we propose a tree-based structure deep network, where each branch is designed to learn a possible high-resolution prediction. At the divergence stage, each branch is trained separately to fit ground truth, and a triple loss is used to enforce the outputs from different branches divergent. Subsequently, we add a fuse module to combine the multiple predictions as the outputs from the first stage can be sub-optimal. The fuse module can be trained to converge w.r.t the final high-resolution image in an end-to-end manner. We conduct evaluations on several benchmarks, including a new proposed dataset with 8x upscaling factor. Our experiments demonstrate that D2C-SR can achieve state-of-the-art performance on PSNR and SSIM, with a significantly less computational cost.
updated: Fri Mar 26 2021 10:20:28 GMT+0000 (UTC)
published: Fri Mar 26 2021 10:20:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト