ニューラルネットワークは、わずかに変更された入力画像を誤って分類する傾向があります。最近、多くの防御策が提案されていますが、ニューラルネットワークの堅牢性を一貫して改善したものはありません。ここでは、このような攻撃に自動的に対抗できるニューラルアーキテクチャを検索するための関数評価として、敵対的攻撃を使用することを提案します。文献からのニューラルアーキテクチャ検索アルゴリズムに関する実験は、正確ではありますが、堅牢なアーキテクチャを見つけることができないことを示しています。これの大きな理由は、それらの限られた検索スペースにあります。密な層を畳み込み層に接続するオプションとその逆のオプションを備えた新しいニューラルアーキテクチャ検索を作成し、検索に連結層を追加することで、敵対的なサンプルで本質的に正確なアーキテクチャを進化させることができました。興味深いことに、進化したアーキテクチャのこの固有の堅牢性は、敵対的トレーニングなどの最先端の防御に匹敵し、敵対的でないサンプルでのみ訓練されます。さらに、進化したアーキテクチャーは、さらに堅牢なものを開発するのに役立つかもしれないいくつかの独特の特性を利用しています。したがって、ここでの結果は、より堅牢なアーキテクチャが存在することを確認するとともに、ニューラルネットワークの開発と探索のための実行可能性の新しい領域を切り開いています。コードはhttp://bit.ly/RobustArchitectureSearchで入手できます。
Neural networks are prone to misclassify slightly modified input images. Recently, many defences have been proposed, but none have improved the robustness of neural networks consistently. Here, we propose to use adversarial attacks as a function evaluation to search for neural architectures that can resist such attacks automatically. Experiments on neural architecture search algorithms from the literature show that although accurate, they are not able to find robust architectures. A significant reason for this lies in their limited search space. By creating a novel neural architecture search with options for dense layers to connect with convolution layers and vice-versa as well as the addition of concatenation layers in the search, we were able to evolve an architecture that is inherently accurate on adversarial samples. Interestingly, this inherent robustness of the evolved architecture rivals state-of-the-art defences such as adversarial training while being trained only on the non-adversarial samples. Moreover, the evolved architecture makes use of some peculiar traits which might be useful for developing even more robust ones. Thus, the results here confirm that more robust architectures exist as well as opens up a new realm of feasibilities for the development and exploration of neural networks. Code available at http://bit.ly/RobustArchitectureSearch.