arXiv reaDer
InFIP: 本質的な機能に基づく説明可能な DNN 知的財産保護方法
InFIP: An Explainable DNN Intellectual Property Protection Method based on Intrinsic Features
ディープ ニューラル ネットワーク (DNN) の知的財産 (IP) 保護は、近年深刻な懸念を引き起こしています。ほとんどの既存の作品は、IP 保護のために DNN モデルに透かしを埋め込んでおり、モデルを変更する必要があり、解釈可能性が欠如しています。この論文では、説明可能な人工知能に基づくDNNの解釈可能な知的財産保護方法を初めて提案します。既存の研究と比較して、提案された方法は DNN モデルを変更せず、所有権検証の決定は解釈可能です。 Deep Taylor Decomposition を使用して、DNN モデルの固有の特徴を抽出します。固有の特徴はモデルの決定の独自の解釈で構成されているため、固有の特徴はモデルのフィンガープリントと見なすことができます。疑わしいモデルのフィンガープリントが元のモデルと同じである場合、疑わしいモデルは海賊版と見なされます。実験結果は、フィンガープリントを使用してモデルの所有権を正常に確認できること、およびモデルのテスト精度に影響がないことを示しています。さらに、提案手法は、微調整攻撃、プルーニング攻撃、透かし上書き攻撃、および適応攻撃に対してロバストです。
Intellectual property (IP) protection for Deep Neural Networks (DNNs) has raised serious concerns in recent years. Most existing works embed watermarks in the DNN model for IP protection, which need to modify the model and lack of interpretability. In this paper, for the first time, we propose an interpretable intellectual property protection method for DNN based on explainable artificial intelligence. Compared with existing works, the proposed method does not modify the DNN model, and the decision of the ownership verification is interpretable. We extract the intrinsic features of the DNN model by using Deep Taylor Decomposition. Since the intrinsic feature is composed of unique interpretation of the model's decision, the intrinsic feature can be regarded as fingerprint of the model. If the fingerprint of a suspected model is the same as the original model, the suspected model is considered as a pirated model. Experimental results demonstrate that the fingerprints can be successfully used to verify the ownership of the model and the test accuracy of the model is not affected. Furthermore, the proposed method is robust to fine-tuning attack, pruning attack, watermark overwriting attack, and adaptive attack.
updated: Fri Oct 14 2022 03:12:36 GMT+0000 (UTC)
published: Fri Oct 14 2022 03:12:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト