arXiv reaDer
学習可能な双方向アテンションマップによる画像修復
Image Inpainting with Learnable Bidirectional Attention Maps
  ほとんどの畳み込みネットワーク(CNN)ベースの修復方法は、標準の畳み込みを採用して有効なピクセルと穴を区別できないように処理し、不規則な穴の処理を制限し、色の不一致と不鮮明さを伴う修復結果を生成しやすくします。この問題に対処するために部分畳み込みが提案されていますが、手作りの機能再正規化を採用し、前方マスク更新のみを考慮しています。この論文では、特徴の繰り込みとマスク更新をエンドツーエンドで学習するための学習可能な注意マップモジュールを提示します。これは、不規則な穴と畳み込み層の伝播に適応するのに効果的です。さらに、学習可能な逆アテンションマップが導入され、U-Netのデコーダーが穴と既知の領域の両方を再構築するのではなく、不規則なホールの充填に集中できるようになり、学習可能な双方向アテンションマップが得られます。定性的および定量的な実験により、当社の方法は、より鋭く、より一貫性があり、視覚的にもっともらしい塗装結果を生成する際に、最先端技術に対して有利に機能することがわかります。ソースコードと事前トレーニングモデルが利用可能になります。
Most convolutional network (CNN)-based inpainting methods adopt standard convolution to indistinguishably treat valid pixels and holes, making them limited in handling irregular holes and more likely to generate inpainting results with color discrepancy and blurriness. Partial convolution has been suggested to address this issue, but it adopts handcrafted feature re-normalization, and only considers forward mask-updating. In this paper, we present a learnable attention map module for learning feature renormalization and mask-updating in an end-to-end manner, which is effective in adapting to irregular holes and propagation of convolution layers. Furthermore, learnable reverse attention maps are introduced to allow the decoder of U-Net to concentrate on filling in irregular holes instead of reconstructing both holes and known regions, resulting in our learnable bidirectional attention maps. Qualitative and quantitative experiments show that our method performs favorably against state-of-the-arts in generating sharper, more coherent and visually plausible inpainting results. The source code and pre-trained models will be available.
updated: Thu Sep 05 2019 12:55:14 GMT+0000 (UTC)
published: Tue Sep 03 2019 06:18:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト