物理世界の敵対的攻撃は、非常に実用的で脅威的な攻撃であり、悪意を持って作成された顕著な現実世界のアーティファクトを生成することで、現実世界の深層学習システムを欺きます。物理世界の攻撃では、人間は不自然な攻撃を簡単に検出して削除できるため、自然性の評価が非常に重要視されます。しかし、現在の研究では自然性をケースバイケースで評価しているため、誤り、偏り、矛盾が生じています。このペーパーでは、自動運転シナリオを最初の試みとして、物理世界の攻撃の視覚的な自然さをベンチマークおよび評価するための第一歩を踏み出します。まず、攻撃の自然性をベンチマークするために、人間の評価と視線を含む最初の物理攻撃の自然性 (PAN) データセットを提供します。 PAN は、いくつかの洞察を初めて検証しました。自然さは、文脈上の特徴 (つまり、環境や意味の変化) によって (別々に) 影響を受け、行動の特徴 (つまり、視線信号) と相関します。次に、人間の評価と一致する攻撃の自然性を自動的に評価するために、モデル推論プロセスに人間の知識を埋め込むことを目的としたデュアル事前アライメント (DPA) ネットワークをさらに導入します。具体的には、DPA は、事前のアライメントを評価することによって自然さの評価における人間の推論を模倣し、事前の注意深いアライメントによって人間の視線動作を模倣します。私たちの研究が、物理世界への攻撃の自然性を改善し、自動的に評価するための研究を促進することを願っています。私たちのコードとデータセットは https://github.com/zhangsn-19/PAN にあります。
Physical world adversarial attack is a highly practical and threatening attack, which fools real world deep learning systems by generating conspicuous and maliciously crafted real world artifacts. In physical world attacks, evaluating naturalness is highly emphasized since human can easily detect and remove unnatural attacks. However, current studies evaluate naturalness in a case-by-case fashion, which suffers from errors, bias and inconsistencies. In this paper, we take the first step to benchmark and assess visual naturalness of physical world attacks, taking autonomous driving scenario as the first attempt. First, to benchmark attack naturalness, we contribute the first Physical Attack Naturalness (PAN) dataset with human rating and gaze. PAN verifies several insights for the first time: naturalness is (disparately) affected by contextual features (i.e., environmental and semantic variations) and correlates with behavioral feature (i.e., gaze signal). Second, to automatically assess attack naturalness that aligns with human ratings, we further introduce Dual Prior Alignment (DPA) network, which aims to embed human knowledge into model reasoning process. Specifically, DPA imitates human reasoning in naturalness assessment by rating prior alignment and mimics human gaze behavior by attentive prior alignment. We hope our work fosters researches to improve and automatically assess naturalness of physical world attacks. Our code and dataset can be found at https://github.com/zhangsn-19/PAN.