arXiv reaDer
画像操作検出のためのオートフォーカスコントラスト学習
Auto-Focus Contrastive Learning for Image Manipulation Detection
一般に、現在の画像改ざん検出モデルは、改ざんの痕跡に基づいて構築されているだけです。ただし、これらのモデルは、次の傾向があるため、最適な検出パフォーマンスを達成できないと主張します。その周辺。これらの制限を克服するために、画像操作検出用のオートフォーカスコントラスト学習 (AF-CL) ネットワークを提案します。これには、マルチスケール ビュー生成 (MSVG) とトレース リレーション モデリング (TRM) という 2 つの主要なアイデアが含まれています。具体的には、MSVG は操作領域とその周辺を異なるスケールで含むビューのペアを生成することを目的としていますが、TRM は各操作領域とその周辺のピクセル間のトレース関係をモデル化し、識別を学習する役割を果たします。表現。対応するビューの表現間の距離を最小化することによって AF-CL ネットワークを学習した後、学習されたネットワークは、操作された領域とその周囲に自動的に焦点を合わせ、正確な操作検出のためにそれらのトレース関係を十分に調査することができます。広範な実験により、最新技術と比較して、AF-CL はパフォーマンスを大幅に向上させることが実証されています。つまり、CAISA、NIST、およびカバレッジ データセットで、それぞれ最大 2.5%、7.5%、および 0.8% の F1 スコアが得られます。 .
Generally, current image manipulation detection models are simply built on manipulation traces. However, we argue that those models achieve sub-optimal detection performance as it tends to: 1) distinguish the manipulation traces from a lot of noisy information within the entire image, and 2) ignore the trace relations among the pixels of each manipulated region and its surroundings. To overcome these limitations, we propose an Auto-Focus Contrastive Learning (AF-CL) network for image manipulation detection. It contains two main ideas, i.e., multi-scale view generation (MSVG) and trace relation modeling (TRM). Specifically, MSVG aims to generate a pair of views, each of which contains the manipulated region and its surroundings at a different scale, while TRM plays a role in modeling the trace relations among the pixels of each manipulated region and its surroundings for learning the discriminative representation. After learning the AF-CL network by minimizing the distance between the representations of corresponding views, the learned network is able to automatically focus on the manipulated region and its surroundings and sufficiently explore their trace relations for accurate manipulation detection. Extensive experiments demonstrate that, compared to the state-of-the-arts, AF-CL provides significant performance improvements, i.e., up to 2.5%, 7.5%, and 0.8% F1 score, on CAISA, NIST, and Coverage datasets, respectively.
updated: Sun Nov 20 2022 09:40:36 GMT+0000 (UTC)
published: Sun Nov 20 2022 09:40:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト