高速オブジェクト検出アルゴリズムで空間コンテキストを利用する利点は、広範囲にわたって研究されてきました。検出器は、画像ごとに単一の順方向パスを実行することで推論速度を向上させます。つまり、予測にコンテキスト推論を暗黙的に使用します。ただし、攻撃者がシーン内の対象オブジェクトと重複しない敵対的なパッチを設計し、コンテキスト推論を利用して標準検出器をだますことができることを示すことができます。このホワイトペーパーでは、この問題を調査し、YOLOなどの広く使用されているオブジェクト検出器を、攻撃者が選択したオブジェクトカテゴリから見えなくする、カテゴリ固有の敵対的なパッチを設計します。また、オブジェクト検出器のトレーニング中に空間コンテキストの使用を制限することで、そのような敵に対する堅牢性が向上することも示しています。敵対的なパッチは対象のオブジェクトの近くにいなくても予測に影響を与える可能性があるため、コンテキストベースの敵対的な攻撃の存在が懸念されています。したがって、このような攻撃からの防御は困難になり、研究コミュニティにはこの脆弱性に注意を払うことをお勧めします。
The benefits of utilizing spatial context in fast object detection algorithms have been studied extensively. Detectors increase inference speed by doing a single forward pass per image which means they implicitly use contextual reasoning for their predictions. However, one can show that an adversary can design adversarial patches which do not overlap with any objects of interest in the scene and exploit contextual reasoning to fool standard detectors. In this paper, we examine this problem and design category specific adversarial patches which make a widely used object detector like YOLO blind to an attacker chosen object category. We also show that limiting the use of spatial context during object detector training improves robustness to such adversaries. We believe the existence of context based adversarial attacks is concerning since the adversarial patch can affect predictions without being in vicinity of any objects of interest. Hence, defending against such attacks becomes challenging and we urge the research community to give attention to this vulnerability.