arXiv reaDer
不調和な地域のローカリゼーション
Inharmonious Region Localization
画像編集技術の進歩により、ユーザーは芸術作品を作成できますが、操作された領域は背景と互換性がない場合があります。不調和な地域をローカライズすることは、魅力的でありながら挑戦的な作業です。このタスクにはマルチスケールコンテキスト情報の効果的な集約と冗長情報の抑制が必要であることを認識し、エンコーダーのマルチスケール機能を融合するために、新しい双方向機能統合(BFI)ブロックとグローバルコンテキストガイドデコーダー(GGD)ブロックを設計します。それぞれとデコーダー。また、エンコーダとデコーダの間にマスクガイドデュアルアテンション(MDA)ブロックを採用して、冗長な情報を抑制しています。画像調和データセットでの実験は、私たちの方法が不調和な領域のローカリゼーションに対して競争力のあるパフォーマンスを達成することを示しています。ソースコードはhttps://github.com/bcmi/DIRLで入手できます。
The advance of image editing techniques allows users to create artistic works, but the manipulated regions may be incompatible with the background. Localizing the inharmonious region is an appealing yet challenging task. Realizing that this task requires effective aggregation of multi-scale contextual information and suppression of redundant information, we design novel Bi-directional Feature Integration (BFI) block and Global-context Guided Decoder (GGD) block to fuse multi-scale features in the encoder and decoder respectively. We also employ Mask-guided Dual Attention (MDA) block between the encoder and decoder to suppress the redundant information. Experiments on the image harmonization dataset demonstrate that our method achieves competitive performance for inharmonious region localization. The source code is available at https://github.com/bcmi/DIRL.
updated: Mon Apr 19 2021 17:12:58 GMT+0000 (UTC)
published: Mon Apr 19 2021 17:12:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト