arXiv reaDer
ブラックボックスディセクタ:消去ベースのハードラベルモデル盗難攻撃に向けて
Black-Box Dissector: Towards Erasing-based Hard-Label Model Stealing Attack
以前の研究では、ブラックボックスモデルの機能が完全な確率出力で盗まれる可能性があることが確認されています。ただし、より実用的なハードラベル設定では、既存の方法で壊滅的なパフォーマンスの低下が発生することがわかります。これは、確率予測に豊富な情報が不足していることと、ハードラベルによって引き起こされる過剰適合が原因であると主張します。この目的のために、2つの消去ベースのモジュールで構成されるブラックボックスディセクタと呼ばれる新しいハードラベルモデルの盗用方法を提案します。 1つは、被害者モデルのハードラベルに隠されている情報容量を増やすように設計されたCAM主導の消去戦略です。もう1つは、代替モデルのソフトラベルを利用して過剰適合を軽減する、ランダム消去ベースの自己認識蒸留モジュールです。広く使用されている4つのデータセットでの広範な実験により、私たちの方法が最先端の方法よりも優れており、最大で8.27%向上していることが一貫して示されています。また、実際のAPIと防御メソッドに対するメソッドの有効性と実用的な可能性を検証します。さらに、私たちの方法は、他のダウンストリームタスク、つまり転送敵対攻撃を促進します。
Previous studies have verified that the functionality of black-box models can be stolen with full probability outputs. However, under the more practical hard-label setting, we observe that existing methods suffer from catastrophic performance degradation. We argue this is due to the lack of rich information in the probability prediction and the overfitting caused by hard labels. To this end, we propose a novel hard-label model stealing method termed black-box dissector, which consists of two erasing-based modules. One is a CAM-driven erasing strategy that is designed to increase the information capacity hidden in hard labels from the victim model. The other is a random-erasing-based self-knowledge distillation module that utilizes soft labels from the substitute model to mitigate overfitting. Extensive experiments on four widely-used datasets consistently demonstrate that our method outperforms state-of-the-art methods, with an improvement of at most 8.27%. We also validate the effectiveness and practical potential of our method on real-world APIs and defense methods. Furthermore, our method promotes other downstream tasks, i.e., transfer adversarial attacks.
updated: Wed Jun 16 2021 04:05:53 GMT+0000 (UTC)
published: Mon May 03 2021 04:12:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト