arXiv reaDer
PatchCensor: 徹底的なテストによる変圧器のパッチの堅牢性認定
PatchCensor: Patch Robustness Certification for Transformers via Exhaustive Testing
ビジョン トランスフォーマー (ViT) は、他の古典的なニューラル ネットワークと同様に高度に非線形であることが知られており、自然なパッチ摂動と敵対的なパッチ摂動の両方によって簡単にだまされる可能性があります。この制限は、特に安全性が重要なシナリオにおいて、実際の産業環境での ViT の展開に脅威を与える可能性があります。この作業では、徹底的なテストを適用することにより、ViT のパッチの堅牢性を証明することを目的として、PatchCensor を提案します。最悪のパッチ攻撃シナリオを考慮して、証明可能な保証を提供しようとします。適応的に侵害される可能性のある敵対的パッチに対する経験的な防御とは異なり、認定された堅牢なアプローチは、特定の条件下での恣意的な攻撃に対して認定された精度を提供できます。ただし、既存のロバスト性認定は、ほとんどがロバスト トレーニングに基づいており、多くの場合、相当なトレーニング努力と、通常のサンプルでのモデル パフォーマンスの犠牲が必要です。ギャップを埋めるために、PatchCensor は、堅牢なモデルをトレーニングしてすべての入力に対して信頼できる結果を提供するように要求するのではなく、異常な入力を検出することによってシステム全体の堅牢性を向上させようとします。具体的には、各入力は、異なる突然変異した注意マスクを使用して複数の推論に投票することによってテストされます。ここで、少なくとも 1 つの推論が異常なパッチを除外することが保証されます。これは完全なカバレッジ テストと見なすことができ、テスト時の推論に対する統計的保証を提供できます。私たちの包括的な評価は、PatchCensor が認定された高い精度 (2% ピクセルの敵対的パッチに対して ImageNet で 67.1% など) を達成できることを示しており、同様のクリーンな精度 (ImageNet で 81.8%) を達成しながら、最先端の技術を大幅に上回っています。一方、私たちの手法は、マスキング戦略を変更するだけで、さまざまな敵対的パッチ サイズ (最大 25%) を処理するための柔軟な構成もサポートしています。
Vision Transformer (ViT) is known to be highly nonlinear like other classical neural networks and could be easily fooled by both natural and adversarial patch perturbations. This limitation could pose a threat to the deployment of ViT in the real industrial environment, especially in safety-critical scenarios. In this work, we propose PatchCensor, aiming to certify the patch robustness of ViT by applying exhaustive testing. We try to provide a provable guarantee by considering the worst patch attack scenarios. Unlike empirical defenses against adversarial patches that may be adaptively breached, certified robust approaches can provide a certified accuracy against arbitrary attacks under certain conditions. However, existing robustness certifications are mostly based on robust training, which often requires substantial training efforts and the sacrifice of model performance on normal samples. To bridge the gap, PatchCensor seeks to improve the robustness of the whole system by detecting abnormal inputs instead of training a robust model and asking it to give reliable results for every input, which may inevitably compromise accuracy. Specifically, each input is tested by voting over multiple inferences with different mutated attention masks, where at least one inference is guaranteed to exclude the abnormal patch. This can be seen as complete-coverage testing, which could provide a statistical guarantee on inference at the test time. Our comprehensive evaluation demonstrates that PatchCensor is able to achieve high certified accuracy (e.g. 67.1% on ImageNet for 2%-pixel adversarial patches), significantly outperforming state-of-the-art techniques while achieving similar clean accuracy (81.8% on ImageNet). Meanwhile, our technique also supports flexible configurations to handle different adversarial patch sizes (up to 25%) by simply changing the masking strategy.
updated: Wed Apr 05 2023 05:21:05 GMT+0000 (UTC)
published: Fri Nov 19 2021 23:45:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト