arXiv reaDer
画像偽造検出のためのフル画像フル解像度のエンドツーエンドのトレーニング可能なCNNフレームワーク
A Full-Image Full-Resolution End-to-End-Trainable CNN Framework for Image Forgery Detection
  計算リソースとメモリリソースが限られているため、現在のディープラーニングモデルは入力でかなり小さな画像のみを受け入れ、予備的な画像のサイズ変更を必要とします。これは、識別機能がサイズ変更によってほとんど影響を受けない、高度な視覚の問題では問題になりません。それどころか、イメージフォレンジックでは、サイズ変更は貴重な高周波の詳細を破壊する傾向があり、パフォーマンスに大きな影響を与えます。画像全体の分析を放棄する代わりに、パッチ単位の処理によってサイズ変更を回避できます。この作業では、CNNベースの画像偽造検出フレームワークを提案します。このフレームワークは、画像全体から収集したフル解像度の情報に基づいて決定を行います。勾配チェックポイントのおかげで、フレームワークは、限られたメモリリソースと弱い(画像レベルの)監督でエンドツーエンドでトレーニング可能であり、すべてのパラメーターの共同最適化が可能です。広範な画像フォレンジックデータセットでの実験により、提案されたアプローチの優れたパフォーマンスが証明されました。これは、すべてのベースラインおよびすべての参照方法を大幅に上回ります。
Due to limited computational and memory resources, current deep learning models accept only rather small images in input, calling for preliminary image resizing. This is not a problem for high-level vision problems, where discriminative features are barely affected by resizing. On the contrary, in image forensics, resizing tends to destroy precious high-frequency details, impacting heavily on performance. One can avoid resizing by means of patch-wise processing, at the cost of renouncing whole-image analysis. In this work, we propose a CNN-based image forgery detection framework which makes decisions based on full-resolution information gathered from the whole image. Thanks to gradient checkpointing, the framework is trainable end-to-end with limited memory resources and weak (image-level) supervision, allowing for the joint optimization of all parameters. Experiments on widespread image forensics datasets prove the good performance of the proposed approach, which largely outperforms all baselines and all reference methods.
updated: Sun Sep 15 2019 07:08:37 GMT+0000 (UTC)
published: Sun Sep 15 2019 07:08:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト