近年、敵対的攻撃と防御に対するコンピューター ビジョン システムへの関心が高まっていますが、現在のところ、ほとんどの調査は画像に限定されています。しかし、多くの人工知能モデルは実際には記録データを扱っており、現実世界の画像とは大きく異なります。したがって、この作業では、ドキュメンタリーおよび自然データに敵対的攻撃の哲学を適用し、そのような攻撃からモデルを保護しようとします。私たちは、ターゲットを絞っていない勾配ベース、転送ベース、およびスコアベースの攻撃に焦点を当て、ResNet50 および EfficientNetB0 モデル アーキテクチャの堅牢性に対する敵対的トレーニング、JPEG 入力圧縮、およびグレースケール入力変換の影響を評価します。私たちの知る限りでは、ドキュメント画像分類タスクに対するこれらの攻撃の影響を研究するためにコミュニティによってそのような作業が行われたことはありません。
Adversarial attacks and defenses have gained increasing interest on computer vision systems in recent years, but as of today, most investigations are limited to images. However, many artificial intelligence models actually handle documentary data, which is very different from real world images. Hence, in this work, we try to apply the adversarial attack philosophy on documentary and natural data and to protect models against such attacks. We focus our work on untargeted gradient-based, transfer-based and score-based attacks and evaluate the impact of adversarial training, JPEG input compression and grey-scale input transformation on the robustness of ResNet50 and EfficientNetB0 model architectures. To the best of our knowledge, no such work has been conducted by the community in order to study the impact of these attacks on the document image classification task.