Practical Relative Order Attack in Deep Ranking
最近の研究では、深いランキングモデルの脆弱性が明らかになっています。このモデルでは、知覚できない摂動がランキング結果の劇的な変化を引き起こす可能性があります。以前の試みは特定の候補者の絶対ランクの操作に焦点を合わせていますが、それらの相対的な順序を調整する可能性はまだ十分に検討されていません。この論文では、ディープランキングシステムに対する新しい敵対的攻撃、つまり、攻撃者が指定した順列に従って選択された候補のセット間の相対的な順序を密かに変更し、他の無関係な候補への干渉を制限する順序攻撃を作成します。具体的には、指定された順列を反映する不等式チェーンを課すトリプレットスタイルの損失として定式化されます。ただし、このようなホワイトボックスの目的を直接最適化することは、さまざまなブラックボックスの制限により、実際の攻撃シナリオでは実行不可能です。それらに対処するために、ホワイトボックス法を近似するためのブラックボックス注文攻撃の代理目的として、短距離順位相関メトリックを提案します。 Order Attackは、ホワイトボックスとブラックボックスの両方の脅威モデルの下で、Fashion-MNISTおよびStanford-Online-Productsデータセットで評価されます。ブラックボックス攻撃は、主要なeコマースプラットフォームにも正常に実装されています。包括的な実験的評価は、提案された方法の有効性を実証し、新しいタイプのランキングモデルの脆弱性を明らかにします。
Recent studies unveil the vulnerabilities of deep ranking models, where an imperceptible perturbation can trigger dramatic changes in the ranking result. While previous attempts focus on manipulating absolute ranks of certain candidates, the possibility of adjusting their relative order remains under-explored. In this paper, we formulate a new adversarial attack against deep ranking systems, i.e., the Order Attack, which covertly alters the relative order among a selected set of candidates according to an attacker-specified permutation, with limited interference to other unrelated candidates. Specifically, it is formulated as a triplet-style loss imposing an inequality chain reflecting the specified permutation. However, direct optimization of such white-box objective is infeasible in a real-world attack scenario due to various black-box limitations. To cope with them, we propose a Short-range Ranking Correlation metric as a surrogate objective for black-box Order Attack to approximate the white-box method. The Order Attack is evaluated on the Fashion-MNIST and Stanford-Online-Products datasets under both white-box and black-box threat models. The black-box attack is also successfully implemented on a major e-commerce platform. Comprehensive experimental evaluations demonstrate the effectiveness of the proposed methods, revealing a new type of ranking model vulnerability.
updated: Mon Aug 09 2021 15:54:56 GMT+0000 (UTC)
published: Tue Mar 09 2021 06:41:18 GMT+0000 (UTC)
