arXiv reaDer
セグメンテーションモデルに対する意味的にステルスな敵対的攻撃
Semantically Stealthy Adversarial Attacks against Segmentation Models
セグメンテーションモデルは、標的型および非標的型の敵対的攻撃に対して脆弱であることがわかっています。ただし、結果として得られるセグメンテーション出力は、多くの場合、非常に損傷しているため、攻撃を簡単に見つけることができます。この論文では、非ターゲットラベルを保持しながら、ターゲットラベルを操作できる意味的にステルスな敵対的攻撃を提案します。 1つの課題は、データセットとモデル間で意味的に意味のある操作を行うことです。もう1つの課題は、対象外のラベルの損傷を回避することです。これらの課題を解決するために、各入力画像を摂動を生成するための事前知識と見なします。また、特徴を抽出するのに役立つ特別な正則化を設計します。モデルのパフォーマンスを評価するために、3つの基本的な攻撃タイプ、つまり「コンテキストへの消失」、「偽のラベルの埋め込み」、および「ターゲットオブジェクトの移動」を設計します。私たちの実験は、私たちのステルスな敵対モデルが、Cityscapes、Mapillary、およびBDD100Kで比較的高い成功率でセグメンテーションモデルを攻撃できることを示しています。私たちのフレームワークは、データセットとモデル全体で優れた経験的一般化を示しています。
Segmentation models have been found to be vulnerable to targeted and non-targeted adversarial attacks. However, the resulting segmentation outputs are often so damaged that it is easy to spot an attack. In this paper, we propose semantically stealthy adversarial attacks which can manipulate targeted labels while preserving non-targeted labels at the same time. One challenge is making semantically meaningful manipulations across datasets and models. Another challenge is avoiding damaging non-targeted labels. To solve these challenges, we consider each input image as prior knowledge to generate perturbations. We also design a special regularizer to help extract features. To evaluate our model's performance, we design three basic attack types, namely `vanishing into the context,' `embedding fake labels,' and `displacing target objects.' Our experiments show that our stealthy adversarial model can attack segmentation models with a relatively high success rate on Cityscapes, Mapillary, and BDD100K. Our framework shows good empirical generalization across datasets and models.
updated: Fri Jan 07 2022 07:29:04 GMT+0000 (UTC)
published: Mon Apr 05 2021 00:56:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト