arXiv reaDer
VQFR:ベクトル量子化辞書と並列デコーダーを使用したブラインドフェイスの復元
VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder
生成的な顔の事前および幾何学的な事前は、最近、ブラインドフェイスの復元に対して高品質の結果を示していますが、入力に忠実なきめの細かい顔の詳細を生成することは、依然として困難な問題です。古典的な辞書ベースの方法と最近のベクトル量子化(VQ)手法に動機付けられて、VQベースの顔復元方法であるVQFRを提案します。 VQFRは、高品質の顔から抽出された高品質の低レベルの機能バンクを利用するため、リアルな顔の詳細を復元するのに役立ちます。ただし、VQコードブックを単純に適用するだけでは、忠実な詳細とIDの保持で良好な結果を得ることができません。したがって、さらに2つの特別なネットワーク設計を紹介します。 1)。最初にVQコードブックの圧縮パッチサイズを調査し、適切な圧縮パッチサイズで設計されたVQコードブックが品質と忠実度のバランスをとるために重要であることを発見しました。 2)。 VQコードブックから生成された現実的な詳細を「汚染」せずに、入力からの低レベルの機能をさらに融合するために、テクスチャデコーダーとメインデコーダーで構成される並列デコーダーを提案しました。次に、これら2つのデコーダーは、変形可能な畳み込みを使用してテクスチャワーピングモジュールと相互作用します。顔の詳細辞書としてのVQコードブックと並列デコーダーの設計を備えた、提案されたVQFRは、以前の方法への忠実度を維持しながら、顔の詳細の復元された品質を大幅に向上させることができます。
Although generative facial prior and geometric prior have recently demonstrated high-quality results for blind face restoration, producing fine-grained facial details faithful to inputs remains a challenging problem. Motivated by the classical dictionary-based methods and the recent vector quantization (VQ) technique, we propose a VQ-based face restoration method - VQFR. VQFR takes advantage of high-quality low-level feature banks extracted from high-quality faces and can thus help recover realistic facial details. However, the simple application of the VQ codebook cannot achieve good results with faithful details and identity preservation. Therefore, we further introduce two special network designs. 1). We first investigate the compression patch size in the VQ codebook and find that the VQ codebook designed with a proper compression patch size is crucial to balance the quality and fidelity. 2). To further fuse low-level features from inputs while not "contaminating" the realistic details generated from the VQ codebook, we proposed a parallel decoder consisting of a texture decoder and a main decoder. Those two decoders then interact with a texture warping module with deformable convolution. Equipped with the VQ codebook as a facial detail dictionary and the parallel decoder design, the proposed VQFR can largely enhance the restored quality of facial details while keeping the fidelity to previous methods.
updated: Mon Jul 25 2022 08:38:02 GMT+0000 (UTC)
published: Fri May 13 2022 17:54:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト