標準の畳み込みニューラルネットワーク(CNN)は、小さな準知覚不可能な人工摂動を伴う画像に簡単にだまされる可能性があります。 CNNの代替として、最近提案されたカプセルネットワーク(CapsNets)は、一般的な攻撃プロトコルの下でCNNよりもホワイトボックス攻撃に対してより堅牢であることが示されています。さらに、CapsNetsのクラス条件付き再構築部分は、敵対的な例を検出するためにも使用されます。この作業では、CapsNetの敵対的な堅牢性、特に出力カプセルが攻撃されたときにCapsNetの内部動作がどのように変化するかを調査します。最初の観察は、敵対的な例が一次カプセルからの投票を操作することによってCapsNetsを誤解させたことです。もう1つの観察結果は、計算コストが高いルーティングメカニズムのために、CNN用に設計されたマルチステップ攻撃方法を直接適用してCapsNetを攻撃する場合の計算コストが高いことです。これらの2つの観察に動機付けられて、CapsNetsの投票を直接攻撃する新しい投票攻撃を提案します。私たちの投票攻撃は、効果的であるだけでなく、ルーティングプロセスを回避することによって効率的でもあります。さらに、投票攻撃を検出認識攻撃パラダイムに統合します。これにより、クラス条件付き再構築ベースの検出方法を正常にバイパスできます。広範な実験により、CapsNetsに対する投票攻撃の優れた攻撃パフォーマンスが実証されています。
Standard Convolutional Neural Networks (CNNs) can be easily fooled by images with small quasi-imperceptible artificial perturbations. As alternatives to CNNs, the recently proposed Capsule Networks (CapsNets) are shown to be more robust to white-box attacks than CNNs under popular attack protocols. Besides, the class-conditional reconstruction part of CapsNets is also used to detect adversarial examples. In this work, we investigate the adversarial robustness of CapsNets, especially how the inner workings of CapsNets change when the output capsules are attacked. The first observation is that adversarial examples misled CapsNets by manipulating the votes from primary capsules. Another observation is the high computational cost, when we directly apply multi-step attack methods designed for CNNs to attack CapsNets, due to the computationally expensive routing mechanism. Motivated by these two observations, we propose a novel vote attack where we attack votes of CapsNets directly. Our vote attack is not only effective but also efficient by circumventing the routing process. Furthermore, we integrate our vote attack into the detection-aware attack paradigm, which can successfully bypass the class-conditional reconstruction based detection method. Extensive experiments demonstrate the superior attack performance of our vote attack on CapsNets.