arXiv reaDer
ディープフォトスキャン:スマートフォンのフォトスキャンにおける実際の劣化に対処するための半教師あり学習
Deep Photo Scan: Semi-Supervised Learning for dealing with the real-world degradation in Smartphone Photo Scanning
物理的な写真をスマートフォンで簡単にスキャンして、デジタルバージョンとして永久に保存できるようになりましたが、スキャンした写真は適切に復元されません。 1つの解決策は、多くのデジタル写真と対応するスキャンされた写真で教師ありディープニューラルネットワークをトレーニングすることです。ただし、人件費が高く、トレーニングデータが限られています。以前の作品は、画像処理技術を使用して劣化をシミュレートすることにより、トレーニングペアを作成します。それらの合成画像は、潜在空間で完全にスキャンされた写真で形成されます。それでも、スマートフォンの写真スキャンの実際の劣化は、レンズの焦点ぼけ、照明条件、印刷による詳細の損失のためにさらに複雑になるため、未解決のままです。さらに、3Dの世界でキャプチャされた形状の歪みにより、データに局所的な構造の不整合が発生し、復元のパフォーマンスと定量的評価の信頼性が低下します。これらの問題を解決するために、半教師ありディープフォトスキャン(DPScan)を提案します。まず、実際の劣化を生成する方法を提示し、スマートフォンでスキャンした写真の復元用のDIV2K-SCANデータセットを提供します。また、ローカルアラインメントは、データに残っている小さなミスアラインメントを減らすために提案されています。次に、低レベルの画像変換を使用して実際の劣化のさまざまなバリエーションをシミュレートし、スマートフォンでスキャンされた画像プロパティを一般化し、劣化ネットワークをトレーニングしてすべてのスタイルの劣化を一般化し、スキャンされていない画像に疑似スキャンされた写真を提供しますまるでスマートフォンでスキャンされたかのように。最後に、スキャンされた画像とスキャンされていない画像の両方で復元ネットワークをトレーニングし、トレーニング画像のコンテンツを多様化できる半教師あり学習を提案します。その結果、提案されたDPScanは、そのベースラインアーキテクチャ、最先端の学術研究、およびスマートフォンの写真スキャンにおける工業製品を定量的および定性的に上回っています。
Physical photographs now can be conveniently scanned by smartphones and stored forever as a digital version, yet the scanned photos are not restored well. One solution is to train a supervised deep neural network on many digital photos and the corresponding scanned photos. However, it requires a high labor cost, leading to limited training data. Previous works create training pairs by simulating degradation using image processing techniques. Their synthetic images are formed with perfectly scanned photos in latent space. Even so, the real-world degradation in smartphone photo scanning remains unsolved since it is more complicated due to lens defocus, lighting conditions, losing details via printing. Besides, locally structural misalignment still occurs in data due to distorted shapes captured in a 3-D world, reducing restoration performance and the reliability of the quantitative evaluation. To solve these problems, we propose a semi-supervised Deep Photo Scan (DPScan). First, we present a way of producing real-world degradation and provide the DIV2K-SCAN dataset for smartphone-scanned photo restoration. Also, Local Alignment is proposed to reduce the minor misalignment remaining in data. Second, we simulate many different variants of the real-world degradation using low-level image transformation to gain a generalization in smartphone-scanned image properties, then train a degradation network to generalize all styles of degradation and provide pseudo-scanned photos for unscanned images as if they were scanned by a smartphone. Finally, we propose a Semi-Supervised Learning that allows our restoration network to be trained on both scanned and unscanned images, diversifying training image content. As a result, the proposed DPScan quantitatively and qualitatively outperforms its baseline architecture, state-of-the-art academic research, and industrial products in smartphone photo scanning.
updated: Wed Aug 18 2021 13:00:36 GMT+0000 (UTC)
published: Thu Feb 11 2021 17:00:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト