arXiv reaDer
Jedi: エントロピーベースのローカリゼーションと敵対的パッチの除去
Jedi: Entropy-based Localization and Removal of Adversarial Patches
現実世界の敵対的な物理パッチは、さまざまなコンピューター ビジョン アプリケーションの最先端モデルを侵害することに成功していることが示されています。入力勾配または特徴分析のいずれかに基づく既存の防御は、自然主義的なパッチを生成する最近の GAN ベースの攻撃によって侵害されています。このホワイトペーパーでは、現実的なパッチ攻撃に対して回復力のある、敵対的なパッチに対する新しい防御である Jedi を提案します。 Jedi は、情報理論の観点からパッチ ローカリゼーションの問題に取り組んでいます。は、2 つの新しいアイデアを活用します。(1) エントロピー分析を使用して潜在的なパッチ領域の識別を改善します。 (2) 高エントロピー カーネルからパッチ領域を完成できるオートエンコーダーを使用して、敵対的パッチのローカリゼーションを改善します。 Jedi は、高精度の敵対的パッチ ローカリゼーションを実現します。これは、イメージを正常に修復するために重要であることを示しています。 Jedi は入力エントロピー分析に依存しているため、モデルに依存せず、保護されたモデルのトレーニングや推論を変更することなく、事前トレーニング済みの市販のモデルに適用できます。 Jedi は、さまざまなベンチマークで平均 90% の敵対的パッチを検出し、成功したパッチ攻撃の最大 94% を回復します (LGS と Jujutsu ではそれぞれ 75% と 65% と比較)。
Real-world adversarial physical patches were shown to be successful in compromising state-of-the-art models in a variety of computer vision applications. Existing defenses that are based on either input gradient or features analysis have been compromised by recent GAN-based attacks that generate naturalistic patches. In this paper, we propose Jedi, a new defense against adversarial patches that is resilient to realistic patch attacks. Jedi tackles the patch localization problem from an information theory perspective; leverages two new ideas: (1) it improves the identification of potential patch regions using entropy analysis: we show that the entropy of adversarial patches is high, even in naturalistic patches; and (2) it improves the localization of adversarial patches, using an autoencoder that is able to complete patch regions from high entropy kernels. Jedi achieves high-precision adversarial patch localization, which we show is critical to successfully repair the images. Since Jedi relies on an input entropy analysis, it is model-agnostic, and can be applied on pre-trained off-the-shelf models without changes to the training or inference of the protected models. Jedi detects on average 90% of adversarial patches across different benchmarks and recovers up to 94% of successful patch attacks (Compared to 75% and 65% for LGS and Jujutsu, respectively).
updated: Thu Apr 20 2023 00:56:59 GMT+0000 (UTC)
published: Thu Apr 20 2023 00:56:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト