arXiv reaDer
振幅-位相再結合:周波数領域での畳み込みニューラルネットワークのロバスト性の再考
Amplitude-Phase Recombination: Rethinking Robustness of Convolutional Neural Networks in Frequency Domain
最近、畳み込みニューラルネットワーク(CNN)の一般化動作は、周波数成分分解を使用した説明手法によって徐々に透過的になります。ただし、堅牢な視覚システムのための画像の位相スペクトルの重要性は依然として無視されています。この論文では、CNNはトレーニング画像の高周波成分に密接に関連する局所最適に収束する傾向がある一方で、振幅スペクトルはノイズや一般的な破損などの影響を受けやすいことに気づきました。対照的に、より経験的な研究では、人間がロバストな認識を達成するためにより多くの位相成分に依存していることがわかりました。この観察結果は、一般的な摂動に対するロバスト性と分布外検出の両方におけるCNNの一般化動作のより多くの説明につながり、現在の画像の位相スペクトルとの振幅スペクトルを再結合することによって設計されたデータ拡張に関する新しい視点を動機付けます。気を散らす画像。つまり、生成されたサンプルにより、CNNは位相成分からの構造化情報により多くの注意を払い、振幅の変動に対してロバストを維持します。いくつかの画像データセットでの実験は、提案された方法が、一般的な破損や表面の変化への適応性、分布外の検出、敵対的な攻撃など、複数の一般化とキャリブレーションタスクで最先端のパフォーマンスを達成することを示しています。
Recently, the generalization behavior of Convolutional Neural Networks (CNN) is gradually transparent through explanation techniques with the frequency components decomposition. However, the importance of the phase spectrum of the image for a robust vision system is still ignored. In this paper, we notice that the CNN tends to converge at the local optimum which is closely related to the high-frequency components of the training images, while the amplitude spectrum is easily disturbed such as noises or common corruptions. In contrast, more empirical studies found that humans rely on more phase components to achieve robust recognition. This observation leads to more explanations of the CNN's generalization behaviors in both robustness to common perturbations and out-of-distribution detection, and motivates a new perspective on data augmentation designed by re-combing the phase spectrum of the current image and the amplitude spectrum of the distracter image. That is, the generated samples force the CNN to pay more attention to the structured information from phase components and keep robust to the variation of the amplitude. Experiments on several image datasets indicate that the proposed method achieves state-of-the-art performances on multiple generalizations and calibration tasks, including adaptability for common corruptions and surface variations, out-of-distribution detection, and adversarial attack.
updated: Thu Aug 19 2021 04:04:41 GMT+0000 (UTC)
published: Thu Aug 19 2021 04:04:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト