arXiv reaDer
視覚言語事前訓練モデルに対する敵対的攻撃に向けて
Towards Adversarial Attack on Vision-Language Pre-training Models
視覚言語事前訓練モデル (VLP) は、さまざまな視覚言語 (V+L) タスクで革命的な改善を示していますが、その敵対的ロバスト性に関する研究はほとんど未踏のままです。この論文では、一般的な VLP モデルと V+L タスクに対する敵対的攻撃を研究しました。まず、さまざまな設定での敵対的攻撃のパフォーマンスを分析しました。さまざまな摂動オブジェクトと攻撃ターゲットの影響を調べることで、強力なマルチモーダル敵対的攻撃の設計と堅牢な VLP モデルの構築の両方に関するガイダンスとして、いくつかの重要な観察結果をまとめました。次に、画像モダリティとテキスト モダリティをまとめて攻撃する、Collaborative Multimodal Adversarial Attack (Co-Attack) と呼ばれる、VLP モデルに対する新しいマルチモーダル攻撃手法を提案しました。実験結果は、提案された方法がさまざまな V+L ダウンストリーム タスクおよび VLP モデルで改善された攻撃パフォーマンスを達成することを実証しました。分析の観察と新しい攻撃方法により、VLP モデルの敵対的堅牢性に関する新しい理解が得られ、より現実的なシナリオでの安全で信頼性の高い展開に貢献できることが期待されます。コードは https://github.com/adversarial-for-goodness/Co-Attack で入手できます。
While vision-language pre-training model (VLP) has shown revolutionary improvements on various vision-language (V+L) tasks, the studies regarding its adversarial robustness remain largely unexplored. This paper studied the adversarial attack on popular VLP models and V+L tasks. First, we analyzed the performance of adversarial attacks under different settings. By examining the influence of different perturbed objects and attack targets, we concluded some key observations as guidance on both designing strong multimodal adversarial attack and constructing robust VLP models. Second, we proposed a novel multimodal attack method on the VLP models called Collaborative Multimodal Adversarial Attack (Co-Attack), which collectively carries out the attacks on the image modality and the text modality. Experimental results demonstrated that the proposed method achieves improved attack performances on different V+L downstream tasks and VLP models. The analysis observations and novel attack method hopefully provide new understanding into the adversarial robustness of VLP models, so as to contribute their safe and reliable deployment in more real-world scenarios. Code is available at https://github.com/adversarial-for-goodness/Co-Attack.
updated: Thu Oct 20 2022 02:32:02 GMT+0000 (UTC)
published: Sun Jun 19 2022 12:55:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト