操作されたピクセルのフォレンジック分析では、画像からさまざまな隠れた微妙な特徴を特定する必要があります。従来の画像認識モデルは、支配的な局所的および空間的特徴に偏っており、より注意深いため、一般にこのタスクで失敗します。この論文では、より細かい画像の不一致をキャプチャし、偽造された領域をより適切に識別するために、ゲーティングメカニズムと組み合わせて非局所的注意を利用する新しいゲーテッドコンテキストアテンションネットワーク(GCA-Net)を提案します。提案されたフレームワークは、高次元の埋め込みを使用して、デコードプロセスのさまざまな段階で粗い特徴マップから関連するコンテキストをフィルタリングおよび集約します。これにより、ネットワークによるグローバルな違いの理解が向上し、誤検知のローカリゼーションが減少します。標準の画像フォレンジックベンチマークに関する評価では、GCA-Netは、最先端のネットワークと競合し、平均4.7%AUC改善できることが示されています。追加のアブレーション研究は、帰属に対するメソッドの堅牢性と誤検出予測に対する回復力も示しています。
Forensic analysis of manipulated pixels requires the identification of various hidden and subtle features from images. Conventional image recognition models generally fail at this task because they are biased and more attentive toward the dominant local and spatial features. In this paper, we propose a novel Gated Context Attention Network (GCA-Net) that utilizes non-local attention in conjunction with a gating mechanism in order to capture the finer image discrepancies and better identify forged regions. The proposed framework uses high dimensional embeddings to filter and aggregate the relevant context from coarse feature maps at various stages of the decoding process. This improves the network's understanding of global differences and reduces false-positive localizations. Our evaluation on standard image forensic benchmarks shows that GCA-Net can both compete against and improve over state-of-the-art networks by an average of 4.7% AUC. Additional ablation studies also demonstrate the method's robustness against attributions and resilience to false-positive predictions.