個人の再識別(re-ID)は、ビデオ監視において非常に重要であるため、最近大きな注目を集めています。一般に、2人の人物の画像を識別するために使用される距離メトリックは、さまざまな外観の変化の下で堅牢であると予想されます。ただし、私たちの作業では、人間が知覚できない摂動を人物の画像に追加するだけで生成される、敵対的な例に対する既存の距離メトリックの極端な脆弱性を観察しています。したがって、ビデオ監視に商用re-IDシステムを導入すると、セキュリティ上の危険性が劇的に高まります。敵対的な例は分類分析に広く適用されていますが、個人の再識別などのメトリック分析で研究されることはめったにありません。最も可能性の高い理由は、re-IDネットワークのトレーニングとテストの間の自然なギャップです。つまり、re-IDネットワークの予測は、効果的なメトリックがないとテスト中に直接使用できません。この作業では、敵対的分類攻撃と並行する方法論である敵対的メトリック攻撃を提案することにより、ギャップを埋めます。包括的な実験により、re-IDシステムにおける敵対的影響が明らかになります。一方、メトリックを保持するネットワークをトレーニングして、敵対的な攻撃からメトリックを防御する初期の試みも紹介します。最後に、さまざまな敵対的な設定をベンチマークすることにより、私たちの作業がメトリックベースのアプリケーションでの敵対的な攻撃と防御の開発を促進できることを期待しています。
Person re-identification (re-ID) has attracted much attention recently due to its great importance in video surveillance. In general, distance metrics used to identify two person images are expected to be robust under various appearance changes. However, our work observes the extreme vulnerability of existing distance metrics to adversarial examples, generated by simply adding human-imperceptible perturbations to person images. Hence, the security danger is dramatically increased when deploying commercial re-ID systems in video surveillance. Although adversarial examples have been extensively applied for classification analysis, it is rarely studied in metric analysis like person re-identification. The most likely reason is the natural gap between the training and testing of re-ID networks, that is, the predictions of a re-ID network cannot be directly used during testing without an effective metric. In this work, we bridge the gap by proposing Adversarial Metric Attack, a parallel methodology to adversarial classification attacks. Comprehensive experiments clearly reveal the adversarial effects in re-ID systems. Meanwhile, we also present an early attempt of training a metric-preserving network, thereby defending the metric against adversarial attacks. At last, by benchmarking various adversarial settings, we expect that our work can facilitate the development of adversarial attack and defense in metric-based applications.