arXiv reaDer
主要なパターン: ディープ ニューラル ネットワークに隠された重要な機能
Dominant Patterns: Critical Features Hidden in Deep Neural Networks
この論文では、Deep NeuralNetworks (DNNs) に隠された重要な機能の存在を発見しました。これらの機能は、目には見えませんが、DNNs の出力を実際に支配することができます。これらの特徴を支配的パターンと呼びます。名前が示すように、自然な画像の場合、DNN の支配的なパターンをそれに追加すると、この DNN の出力は、元の画像ではなく支配的なパターンによって決定されます。つまり、DNN の予測は支配的なパターンの予測と同じです。 .特徴空間の無感性を追求することで、そのようなパターンを見つけるアルゴリズムを設計します。支配的なパターンの直接的な適用は、Universal Adversarial Perturbations (UAPs) です。数値実験は、発見された支配的なパターンが、特にラベルのない設定で、最先端の UAP メソッドを打ち負かすことを示しています。さらに、支配的なパターンは、DNN が同じバックボーンを共有するダウンストリーム タスクを攻撃する可能性があることが証明されています。 DNN 固有の支配的なパターンは、DNN のいくつかの本質的な特性を明らかにし、その特徴分析と堅牢性の強化にとって非常に重要であると主張しています。
In this paper, we find the existence of critical features hidden in Deep NeuralNetworks (DNNs), which are imperceptible but can actually dominate the outputof DNNs. We call these features dominant patterns. As the name suggests, for a natural image, if we add the dominant pattern of a DNN to it, the output of this DNN is determined by the dominant pattern instead of the original image, i.e., DNN's prediction is the same with the dominant pattern's. We design an algorithm to find such patterns by pursuing the insensitivity in the feature space. A direct application of the dominant patterns is the Universal Adversarial Perturbations(UAPs). Numerical experiments show that the found dominant patterns defeat state-of-the-art UAP methods, especially in label-free settings. In addition, dominant patterns are proved to have the potential to attack downstream tasks in which DNNs share the same backbone. We claim that DNN-specific dominant patterns reveal some essential properties of a DNN and are of great importance for its feature analysis and robustness enhancement.
updated: Mon May 31 2021 15:43:04 GMT+0000 (UTC)
published: Mon May 31 2021 15:43:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト