GAN-Leaks: A Taxonomy of Membership Inference Attacks against Generative Models
ディープラーニングは、判別モデルから生成モデルに至るまで、圧倒的な成功を収めてきました。特に、深い生成モデルは、メディア操作から無害化されたデータセットの生成に至るまで、無数の領域で新しいレベルのパフォーマンスを促進しました。大成功にもかかわらず、生成モデルによって引き起こされるプライバシー侵害の潜在的なリスクは、体系的に分析されていません。このホワイトペーパーでは、被害者モデルに使用されるトレーニングデータに関する情報を明らかにする深い生成モデルに対するメンバーシップ推論攻撃に焦点を当てます。具体的には、既存の攻撃だけでなく新規攻撃も含む、メンバーシップ推論攻撃の最初の分類法を示します。さらに、幅広い設定でインスタンス化でき、さまざまな種類の深生成モデルに適用できる最初の一般的な攻撃モデルを提案します。さらに、さまざまな攻撃設定、データモダリティ、およびトレーニング構成にわたって、すべての場合において攻撃パフォーマンスを一貫して向上させる、理論に基づいた攻撃調整手法を提供します。さまざまな攻撃の有効性を調査する包括的な実験的研究によって、攻撃パフォーマンスの体系的な分析を補足します。 3つの多様なアプリケーションシナリオ(画像、医療データ、場所データなど)にわたるモデルタイプとトレーニング構成。
Deep learning has achieved overwhelming success, spanning from discriminative models to generative models. In particular, deep generative models have facilitated a new level of performance in a myriad of areas, ranging from media manipulation to sanitized dataset generation. Despite the great success, the potential risks of privacy breach caused by generative models have not been analyzed systematically. In this paper, we focus on membership inference attack against deep generative models that reveals information about the training data used for victim models. Specifically, we present the first taxonomy of membership inference attacks, encompassing not only existing attacks but also our novel ones. In addition, we propose the first generic attack model that can be instantiated in a large range of settings and is applicable to various kinds of deep generative models. Moreover, we provide a theoretically grounded attack calibration technique, which consistently boosts the attack performance in all cases, across different attack settings, data modalities, and training configurations. We complement the systematic analysis of attack performance by a comprehensive experimental study, that investigates the effectiveness of various attacks w.r.t. model type and training configurations, over three diverse application scenarios (i.e., images, medical data, and location data).
updated: Mon Nov 23 2020 18:11:05 GMT+0000 (UTC)
published: Mon Sep 09 2019 15:34:07 GMT+0000 (UTC)
