ディープニューラルネットワーク(DNN)は、さまざまなコンピュータービジョンタスクで大きな成功を収めていますが、敵対攻撃に対して非常に脆弱です。この問題に対処するために、得られたモデルが敵対的な例に抵抗することを学ぶように、正則化項を埋め込むマージンベースのトリプレットを分類目的に統合することにより、表現空間の局所的な平滑性を改善することを提案します。正則化の用語は、潜在的な摂動を見つけ、反復的な方法で大きなマージンでそれらを罰する2段階の最適化で構成されます。 MNIST、CASIA-WebFace、VGGFace2、およびMS-Celeb-1Mの実験結果は、単純なオブジェクト分類と深層顔認識において、特徴とラベルの両方の攻撃に対するネットワークの堅牢性が向上することを示しています。
The Deep neural networks (DNNs) have achieved great success on a variety of computer vision tasks, however, they are highly vulnerable to adversarial attacks. To address this problem, we propose to improve the local smoothness of the representation space, by integrating a margin-based triplet embedding regularization term into the classification objective, so that the obtained model learns to resist adversarial examples. The regularization term consists of two steps optimizations which find potential perturbations and punish them by a large margin in an iterative way. Experimental results on MNIST, CASIA-WebFace, VGGFace2 and MS-Celeb-1M reveal that our approach increases the robustness of the network against both feature and label adversarial attacks in simple object classification and deep face recognition.