arXiv reaDer
対照学習と教師なしクラスタリングによる画像偽造検出の再考
Rethinking Image Forgery Detection via Contrastive Learning and Unsupervised Clustering
画像偽造検出は、画像内の偽造領域を検出して特定することを目的としています。既存の偽造検出アルゴリズムのほとんどは、ピクセルを偽造または新品に分類するための分類問題を定式化します。ただし、偽造ピクセルと元のピクセルの定義は 1 つの単一画像内でのみ相対的なものです。たとえば、画像 A の偽造領域は、ソース画像 B では実際には元の領域です (スプライシング偽造)。このような相対的な定義は、異なる画像にわたる偽造 (元の) 領域を同じカテゴリに不必要に混合する既存の方法では大幅に見落とされてきました。このジレンマを解決するために、我々は、FOrensic ContrAstive cLustering (FOCAL) 手法を提案します。これは、画像偽造検出のための対照学習と教師なしクラスタリングに基づく、新規でシンプルでありながら非常に効果的なパラダイムです。具体的には、FOCAL 1) ピクセルレベルの対照学習を利用して、画像ごとに高レベルの法医学的特徴抽出を監視し、上記の相対的な定義を明確に反映しています。 2) オンザフライの教師なしクラスタリング アルゴリズム (トレーニング済みのアルゴリズムではなく) を採用して、学習された特徴を偽造/元のカテゴリにクラスター化し、トレーニング データからの画像間の影響をさらに抑制します。 3) 再トレーニングを必要とせずに、単純な特徴レベルの連結によって検出パフォーマンスをさらに向上させることができます。 6 つの公開テスト データセットにわたる広範な実験結果は、私たちが提案する FOCAL が、最新の競合アルゴリズムよりも大幅に優れていることを示しています: カバレッジで +24.3%、Columbia で +18.6%、FF++ で +17.5%、+14.2% IoU に関しては、MISD では +13.5%、CASIA では +13.5%、NIST では +10.3% でした。 FOCAL のパラダイムは、新たな洞察をもたらし、画像偽造検出タスクの新しいベンチマークとして機能する可能性があります。コードは https://github.com/HighwayWu/FOCAL で入手できます。
Image forgery detection aims to detect and locate forged regions in an image. Most existing forgery detection algorithms formulate classification problems to classify pixels into forged or pristine. However, the definition of forged and pristine pixels is only relative within one single image, e.g., a forged region in image A is actually a pristine one in its source image B (splicing forgery). Such a relative definition has been severely overlooked by existing methods, which unnecessarily mix forged (pristine) regions across different images into the same category. To resolve this dilemma, we propose the FOrensic ContrAstive cLustering (FOCAL) method, a novel, simple yet very effective paradigm based on contrastive learning and unsupervised clustering for the image forgery detection. Specifically, FOCAL 1) utilizes pixel-level contrastive learning to supervise the high-level forensic feature extraction in an image-by-image manner, explicitly reflecting the above relative definition; 2) employs an on-the-fly unsupervised clustering algorithm (instead of a trained one) to cluster the learned features into forged/pristine categories, further suppressing the cross-image influence from training data; and 3) allows to further boost the detection performance via simple feature-level concatenation without the need of retraining. Extensive experimental results over six public testing datasets demonstrate that our proposed FOCAL significantly outperforms the state-of-the-art competing algorithms by big margins: +24.3% on Coverage, +18.6% on Columbia, +17.5% on FF++, +14.2% on MISD, +13.5% on CASIA and +10.3% on NIST in terms of IoU. The paradigm of FOCAL could bring fresh insights and serve as a novel benchmark for the image forgery detection task. The code is available at https://github.com/HighwayWu/FOCAL.
updated: Fri Aug 18 2023 05:05:30 GMT+0000 (UTC)
published: Fri Aug 18 2023 05:05:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト