arXiv reaDer
JPGNet:画像修復のための共同予測フィルタリングと生成ネットワーク
JPGNet: Joint Predictive Filtering and Generative Network for Image Inpainting
画像修復は、欠落した領域を復元し、復元結果を元の完全な画像と同じにすることを目的としています。これは、生成された画像の自然さを強調する一般的な生成タスクとは異なります。それにもかかわらず、既存の作品は通常、それを純粋な生成の問題と見なし、それに対処するために最先端の生成技術を採用しています。生成ネットワークは、主要な欠落部分を現実的な内容で埋めますが、通常、ローカル構造を歪めます。この論文では、画像修復を2つの問題、つまり予測フィルタリングとディープ生成の組み合わせとして定式化します。予測フィルタリングは、局所構造の保存とアーティファクトの除去には優れていますが、大きな欠落領域を完成させるには不十分です。深い生成ネットワークは、シーン全体の理解に基づいて多数の欠落したピクセルを埋めることができますが、元のピクセルと同じ詳細を復元することはほとんどありません。それぞれの利点を活用するために、予測フィルタリングと不確実性ネットワーク(PFUNet)、深層生成ネットワーク、不確実性認識融合ネットワーク(UAFNet)の3つのブランチを含む共同予測フィルタリングと生成ネットワーク(JPGNet)を提案します。 PFUNetは、入力画像に従ってフィルタリングベースの修復用のピクセル単位のカーネルを適応的に予測し、不確実性マップを出力できます。このマップは、ピクセルがフィルタリングまたは生成ネットワークによって処理される必要があることを示しています。これは、フィルタリングと生成結果のスマートな組み合わせのためにUAFNetにさらに供給されます。画像修復問題の新しいフレームワークとしての私たちの方法は、既存の世代ベースの方法に利益をもたらす可能性があることに注意してください。 3つの公開データセット(Dunhuang、Places2、CelebA)でメソッドを検証し、このメソッドが3つの最先端の生成メソッド(StructFlow、EdgeConnect、RFRNet)をわずかに追加することで大幅に強化できることを示します。時間コスト。
Image inpainting aims to restore the missing regions and make the recovery results identical to the originally complete image, which is different from the common generative task emphasizing the naturalness of generated images. Nevertheless, existing works usually regard it as a pure generation problem and employ cutting-edge generative techniques to address it. The generative networks fill the main missing parts with realistic contents but usually distort the local structures. In this paper, we formulate image inpainting as a mix of two problems, i.e., predictive filtering and deep generation. Predictive filtering is good at preserving local structures and removing artifacts but falls short to complete the large missing regions. The deep generative network can fill the numerous missing pixels based on the understanding of the whole scene but hardly restores the details identical to the original ones. To make use of their respective advantages, we propose the joint predictive filtering and generative network (JPGNet) that contains three branches: predictive filtering & uncertainty network (PFUNet), deep generative network, and uncertainty-aware fusion network (UAFNet). The PFUNet can adaptively predict pixel-wise kernels for filtering-based inpainting according to the input image and output an uncertainty map. This map indicates the pixels should be processed by filtering or generative networks, which is further fed to the UAFNet for a smart combination between filtering and generative results. Note that, our method as a novel framework for the image inpainting problem can benefit any existing generation-based methods. We validate our method on three public datasets, i.e., Dunhuang, Places2, and CelebA, and demonstrate that our method can enhance three state-of-the-art generative methods (i.e., StructFlow, EdgeConnect, and RFRNet) significantly with the slightly extra time cost.
updated: Fri Jul 09 2021 07:49:52 GMT+0000 (UTC)
published: Fri Jul 09 2021 07:49:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト