機械学習モデルに対する敵対的な攻撃は、過去数年で関心が高まっています。畳み込みニューラルネットワークの入力にわずかな変更を加えるだけで、ネットワークの出力を揺らして、まったく異なる結果を出力できます。最初の攻撃は、入力画像のピクセル値をわずかに変更して分類器を欺いて間違ったクラスを出力することでこれを行いました。他のアプローチは、検出器と分類器をだますためにオブジェクトに適用できる「パッチ」を学習しようとしました。これらのアプローチのいくつかは、これらの攻撃が現実世界で実行可能であることも示しています。つまり、オブジェクトを修正し、ビデオカメラで撮影することです。ただし、これらのアプローチはすべて、クラス内の多様性をほとんど含まないクラス(例:一時停止標識)を対象としています。次に、オブジェクトの既知の構造を使用して、その上に敵対的なパッチを生成します。この論文では、多くのクラス内の多様性を持つターゲット、つまり人間に対して敵対的なパッチを生成するアプローチを提示します。目標は、人物を人物検出器から正常に隠すことができるパッチを生成することです。たとえば、悪意を持って監視システムを回避するために使用できる攻撃で、侵入者は、監視カメラに向けて体の前に小さな段ボールプレートを保持することで、検出されずに忍び寄ることができます。この結果から、システムが人検出器の精度を大幅に下げることができることがわかります。私たちのアプローチは、パッチがカメラで撮影される実際のシナリオでもうまく機能します。私たちの知る限り、私たちは人のような高レベルのクラス内の多様性を持つターゲットにこの種の攻撃を試みる最初の試みです。
Adversarial attacks on machine learning models have seen increasing interest in the past years. By making only subtle changes to the input of a convolutional neural network, the output of the network can be swayed to output a completely different result. The first attacks did this by changing pixel values of an input image slightly to fool a classifier to output the wrong class. Other approaches have tried to learn "patches" that can be applied to an object to fool detectors and classifiers. Some of these approaches have also shown that these attacks are feasible in the real-world, i.e. by modifying an object and filming it with a video camera. However, all of these approaches target classes that contain almost no intra-class variety (e.g. stop signs). The known structure of the object is then used to generate an adversarial patch on top of it. In this paper, we present an approach to generate adversarial patches to targets with lots of intra-class variety, namely persons. The goal is to generate a patch that is able successfully hide a person from a person detector. An attack that could for instance be used maliciously to circumvent surveillance systems, intruders can sneak around undetected by holding a small cardboard plate in front of their body aimed towards the surveillance camera. From our results we can see that our system is able significantly lower the accuracy of a person detector. Our approach also functions well in real-life scenarios where the patch is filmed by a camera. To the best of our knowledge we are the first to attempt this kind of attack on targets with a high level of intra-class variety like persons.