arXiv reaDer
マルチスケール ConvNeXt 機能融合による効果的な画像改ざんローカリゼーション
Effective Image Tampering Localization with Multi-Scale ConvNeXt Feature Fusion
強力な画像編集ツールが広く使用されるようになったことで、画像の改ざんが容易かつ現実的になりました。既存の画像フォレンジック手法は、一般化のパフォーマンスと堅牢性が低いという課題に直面しています。このレターでは、ConvNeXt ネットワークとマルチスケール機能融合に基づく効果的な画像改ざん位置特定スキームを提案します。積み重ねられた ConvNeXt ブロックはエンコーダーとして使用され、階層的なマルチスケール機能をキャプチャします。これは、改ざんされたピクセルを正確に特定するためにデコーダーで融合されます。モデルのパフォーマンスをさらに向上させるために、複合損失と効果的なデータ拡張が採用されています。広範な実験結果は、提案されたスキームのローカリゼーションパフォーマンスが他の最先端のものよりも優れていることを示しています。ソース コードは、https://github.com/ZhuHC98/ITL-SSN で入手できます。
With the widespread use of powerful image editing tools, image tampering becomes easy and realistic. Existing image forensic methods still face challenges of low generalization performance and robustness. In this letter, we propose an effective image tampering localization scheme based on ConvNeXt network and multi-scale feature fusion. Stacked ConvNeXt blocks are used as an encoder to capture hierarchical multi-scale features, which are then fused in decoder for locating tampered pixels accurately. Combined loss and effective data augmentation are adopted to further improve the model performance. Extensive experimental results show that localization performance of our proposed scheme outperforms other state-of-the-art ones. The source code will be available at https://github.com/ZhuHC98/ITL-SSN.
updated: Mon Jan 16 2023 05:48:43 GMT+0000 (UTC)
published: Mon Aug 29 2022 17:22:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト