arXiv reaDer
ロバスト モデルとジェネレーティブ モデルの関係を探る
Exploring the Connection between Robust and Generative Models
敵対的トレーニング (AT) でトレーニングされた堅牢な識別分類器を、エネルギーベース モデル (EBM) の形で生成モデリングと接続する研究を提供します。識別分類器の損失を分解し、識別モデルが入力データ密度も認識していることを示すことで、これを行います。一般的な仮定は、敵対点が入力データの多様体を離れるというものですが、驚くべきことに、入力空間内の対象外の敵対点は、識別分類器内に隠された生成モデルの下にある可能性が非常に高いことがわかりました。 EBM。 2 つの証拠を提示します。非標的型攻撃は自然データよりも可能性が高く、攻撃強度が増すにつれてその可能性も高くなります。これにより、それらを簡単に検出し、分類器をだましてデータセットと同様のエネルギーを持つ、High-Energy PGD と呼ばれる新しい攻撃を作成することができます。
We offer a study that connects robust discriminative classifiers trained with adversarial training (AT) with generative modeling in the form of Energy-based Models (EBM). We do so by decomposing the loss of a discriminative classifier and showing that the discriminative model is also aware of the input data density. Though a common assumption is that adversarial points leave the manifold of the input data, our study finds out that, surprisingly, untargeted adversarial points in the input space are very likely under the generative model hidden inside the discriminative classifier -- have low energy in the EBM. We present two evidence: untargeted attacks are even more likely than the natural data and their likelihood increases as the attack strength increases. This allows us to easily detect them and craft a novel attack called High-Energy PGD that fools the classifier yet has energy similar to the data set.
updated: Sat Apr 08 2023 15:04:26 GMT+0000 (UTC)
published: Sat Apr 08 2023 15:04:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト