arXiv reaDer
生成的敵対的ネットワークにおけるモデルの抽出と防御
Model Extraction and Defenses on Generative Adversarial Networks
モデル抽出攻撃は、ターゲットモデルへのクエリアクセスを通じて機械学習モデルを複製することを目的としています。初期の研究は主に識別モデルに焦点を合わせています。成功したにもかかわらず、生成モデルに対するモデル抽出攻撃はあまりよく調べられていません。この論文では、生成的敵対的ネットワーク(GAN)に対するモデル抽出攻撃の実現可能性を体系的に研究します。具体的には、まず、GANに対するモデル抽出攻撃の精度と忠実度を定義します。次に、敵対者の目標と背景知識に従って、精度抽出と忠実度抽出の観点から、GANに対するモデル抽出攻撃を研究します。さらに、300万を超える画像でトレーニングされた最先端のGANを盗む抽出モデルの知識を攻撃者が新しいドメインに転送して、モデル抽出攻撃の適用範囲を広げることができるケーススタディを実施します。最後に、GANモデルの有用性とセキュリティの間のトレードオフを考慮して、GANを保護するための効果的な防御手法を提案します。
Model extraction attacks aim to duplicate a machine learning model through query access to a target model. Early studies mainly focus on discriminative models. Despite the success, model extraction attacks against generative models are less well explored. In this paper, we systematically study the feasibility of model extraction attacks against generative adversarial networks (GANs). Specifically, we first define accuracy and fidelity on model extraction attacks against GANs. Then we study model extraction attacks against GANs from the perspective of accuracy extraction and fidelity extraction, according to the adversary's goals and background knowledge. We further conduct a case study where an adversary can transfer knowledge of the extracted model which steals a state-of-the-art GAN trained with more than 3 million images to new domains to broaden the scope of applications of model extraction attacks. Finally, we propose effective defense techniques to safeguard GANs, considering a trade-off between the utility and security of GAN models.
updated: Wed Jan 06 2021 14:36:21 GMT+0000 (UTC)
published: Wed Jan 06 2021 14:36:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト