arXiv reaDer
いくつかのクエリによる勾配調整攻撃
Gradient Aligned Attacks via a Few Queries
被害者モデルの出力のみに依存するブラックボックス クエリ攻撃は、深層学習モデルの攻撃に効果的であることが証明されています。ただし、既存のブラックボックス クエリ攻撃は、少数のクエリしか許可されない新しいシナリオではパフォーマンスが低下します。この問題に対処するために、勾配調整攻撃 (GAA) を提案します。これは、サロゲート モデルで設計した勾配調整損失 (GAL) を使用して正確な勾配を推定し、被害者モデルでの攻撃パフォーマンスを向上させます。具体的には、ロジット ベクトルに関する損失関数の導関数が、サロゲート モデルとビクティム モデルの間で同じ重み係数を持つことを保証する勾配調整メカニズムを提案します。このメカニズムを使用して、クロスエントロピー (CE) 損失とマージン損失を勾配に沿った形式、つまり勾配に沿った CE またはマージン損失に変換します。これらの損失は、新しいシナリオでの勾配調整攻撃の攻撃パフォーマンスを向上させるだけでなく、既存のブラック ボックス クエリ攻撃のクエリ効率も向上させます。 ImageNet データベースの理論的および経験的分析を通じて、勾配整列メカニズムが効果的であること、および勾配整列攻撃が新しいシナリオの攻撃パフォーマンスを l_2 および l_∞ ノルムで 16.1% および 31.3% 改善できることを示します。それぞれ、最新の 4 つの転送可能な事前ベースのクエリ攻撃と比較して、ボックス制約。さらに、勾配調整損失により、これらの転送可能な事前ベースのクエリ攻撃で必要なクエリの数が最大 2.9 倍減少します。全体として、提案された勾配調整攻撃と損失は、特に少数のクエリしか許可されていないシナリオで、ブラック ボックス クエリ攻撃の攻撃パフォーマンスとクエリ効率が大幅に改善されていることを示しています。
Black-box query attacks, which rely only on the output of the victim model, have proven to be effective in attacking deep learning models. However, existing black-box query attacks show low performance in a novel scenario where only a few queries are allowed. To address this issue, we propose gradient aligned attacks (GAA), which use the gradient aligned losses (GAL) we designed on the surrogate model to estimate the accurate gradient to improve the attack performance on the victim model. Specifically, we propose a gradient aligned mechanism to ensure that the derivatives of the loss function with respect to the logit vector have the same weight coefficients between the surrogate and victim models. Using this mechanism, we transform the cross-entropy (CE) loss and margin loss into gradient aligned forms, i.e. the gradient aligned CE or margin losses. These losses not only improve the attack performance of our gradient aligned attacks in the novel scenario but also increase the query efficiency of existing black-box query attacks. Through theoretical and empirical analysis on the ImageNet database, we demonstrate that our gradient aligned mechanism is effective, and that our gradient aligned attacks can improve the attack performance in the novel scenario by 16.1% and 31.3% on the l_2 and l_∞ norms of the box constraint, respectively, compared to four latest transferable prior-based query attacks. Additionally, the gradient aligned losses also significantly reduce the number of queries required in these transferable prior-based query attacks by a maximum factor of 2.9 times. Overall, our proposed gradient aligned attacks and losses show significant improvements in the attack performance and query efficiency of black-box query attacks, particularly in scenarios where only a few queries are allowed.
updated: Wed May 03 2023 02:10:31 GMT+0000 (UTC)
published: Thu May 19 2022 12:32:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト