arXiv reaDer
ロバストモデルと生成モデルの間の関係を探る
Exploring the Connection between Robust and Generative Models
私たちは、敵対的トレーニング (AT) でトレーニングされた堅牢な識別分類器と、エネルギーベース モデル (EBM) の形式での生成モデリングを接続する研究を提供します。これを行うには、識別分類器の損失を分解し、識別モデルが入力データ密度も認識していることを示します。敵対的ポイントは入力データの多様体から離れるというのが一般的な仮定ですが、私たちの研究では、驚くべきことに、入力空間内のターゲットにされていない敵対的ポイントは、識別分類器内に隠された生成モデルの下にある可能性が非常に高いことがわかりました。 EBM。私たちは 2 つの証拠を提示します。ターゲットを絞っていない攻撃は自然データよりも発生する可能性がさらに高く、攻撃強度が増加するにつれてその可能性も高まります。これにより、それらを簡単に検出し、分類器をだましてデータセットと同様のエネルギーを持つ High-Energy PGD と呼ばれる新しい攻撃を作成することができます。コードは github.com/senad96/Robust-Generative で入手できます。
We offer a study that connects robust discriminative classifiers trained with adversarial training (AT) with generative modeling in the form of Energy-based Models (EBM). We do so by decomposing the loss of a discriminative classifier and showing that the discriminative model is also aware of the input data density. Though a common assumption is that adversarial points leave the manifold of the input data, our study finds out that, surprisingly, untargeted adversarial points in the input space are very likely under the generative model hidden inside the discriminative classifier -- have low energy in the EBM. We present two evidence: untargeted attacks are even more likely than the natural data and their likelihood increases as the attack strength increases. This allows us to easily detect them and craft a novel attack called High-Energy PGD that fools the classifier yet has energy similar to the data set. The code is available at github.com/senad96/Robust-Generative
updated: Mon Jun 05 2023 15:23:05 GMT+0000 (UTC)
published: Sat Apr 08 2023 15:04:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト