arXiv reaDer
TFill:Transformerベースのアーキテクチャによる画像の完成
TFill: Image Completion via a Transformer-Based Architecture
大きなマスクを使用して高品質の画像を完成させるには、離れたコンテキストの相互作用を橋渡しすることが重要です。深いまたは大きな受容野(RF)畳み込みを介してこれを試みる以前の方法は、劣っている可能性がある近くの相互作用の優位性から逃れることはできません。この論文では、画像の完成を方向性のないシーケンス間予測タスクとして扱うことを提案し、トランスフォーマーを展開して、最初のフェーズでエンコーダーの長距離依存性を直接キャプチャします。重要なのは、トークン表現に小さくて重複しないRFを備えた制限CNNを採用することです。これにより、トランスフォーマーは、より大きなRFが使用されたときに隣接するトークンを暗黙的に混乱させることなく、すべてのレイヤーで同じ重要度の長距離コンテキスト関係を明示的にモデル化できます。第2段階では、可視領域と生成領域の間の外観の一貫性を向上させるために、新しい注意認識層(AAL)を導入して、遠方に関連する機能をより有効に活用し、標準的な注意の孤立効果を回避します。全体として、広範な実験は、いくつかのデータセットでの最先端の方法と比較して優れたパフォーマンスを示しています。
Bridging distant context interactions is important for high quality image completion with large masks. Previous methods attempting this via deep or large receptive field (RF) convolutions cannot escape from the dominance of nearby interactions, which may be inferior. In this paper, we propose treating image completion as a directionless sequence-to-sequence prediction task, and deploy a transformer to directly capture long-range dependence in the encoder in a first phase. Crucially, we employ a restrictive CNN with small and non-overlapping RF for token representation, which allows the transformer to explicitly model the long-range context relations with equal importance in all layers, without implicitly confounding neighboring tokens when larger RFs are used. In a second phase, to improve appearance consistency between visible and generated regions, a novel attention-aware layer (AAL) is introduced to better exploit distantly related features and also avoid the insular effect of standard attention. Overall, extensive experiments demonstrate superior performance compared to state-of-the-art methods on several datasets.
updated: Fri Apr 02 2021 01:42:01 GMT+0000 (UTC)
published: Fri Apr 02 2021 01:42:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト