arXiv reaDer
TamperNN:展開されたニューラルネットの効率的な改ざん検出
TamperNN: Efficient Tampering Detection of Deployed Neural Nets
  ニューラルネットワークは、組み込みデバイスとモノのインターネットの展開を促進しています。アプリケーションは、パーソナルアシスタントから自動運転車などの重要なアシスタントにまで及びます。最近、ニューラルネットから取得したモデルをトロイの木馬にできることが示されています。その後、攻撃者は細工された入力に直面する任意のモデル動作をトリガーできます。これは、展開されたデバイスのセキュリティと信頼性に重大な影響を及ぼします。展開されたモデル、特に分類子の改ざんを検出する新しいアルゴリズムを導入します。検討するリモートインタラクションのセットアップでは、モデルが攻撃された場合にクラスを変更する可能性が高いモデル入力空間のマーカーを特定し、ユーザーが改ざんの可能性を検出できるようにする戦略を提案します。このセットアップにより、埋め込みモデルや予測APIを介して公開されるモデルなど、さまざまなシナリオとの互換性が提案されます。これらの改ざん検出アルゴリズムを、3つの異なるタイプのニューラルネット上の標準的なMNISTデータセットで実験し、5つの異なる攻撃(トロイの木馬、量子化、微調整、圧縮、透かし)に直面しています。次に、最新のデータセット(VGGFace2)で5つの大きなモデル(VGG16、VGG19、ResNet、MobileNet、DenseNet)を検証し、モデル改ざんの効率的な検出の可能性を示す結果を報告します。
Neural networks are powering the deployment of embedded devices and Internet of Things. Applications range from personal assistants to critical ones such as self-driving cars. It has been shown recently that models obtained from neural nets can be trojaned ; an attacker can then trigger an arbitrary model behavior facing crafted inputs. This has a critical impact on the security and reliability of those deployed devices. We introduce novel algorithms to detect the tampering with deployed models, classifiers in particular. In the remote interaction setup we consider, the proposed strategy is to identify markers of the model input space that are likely to change class if the model is attacked, allowing a user to detect a possible tampering. This setup makes our proposal compatible with a wide range of scenarios, such as embedded models, or models exposed through prediction APIs. We experiment those tampering detection algorithms on the canonical MNIST dataset, over three different types of neural nets, and facing five different attacks (trojaning, quantization, fine-tuning, compression and watermarking). We then validate over five large models (VGG16, VGG19, ResNet, MobileNet, DenseNet) with a state of the art dataset (VGGFace2), and report results demonstrating the possibility of an efficient detection of model tampering.
updated: Thu Sep 05 2019 11:42:19 GMT+0000 (UTC)
published: Fri Mar 01 2019 14:32:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト