arXiv reaDer
The Devil's Advocate: 拡散モデルを使用して、悪用できないデータの幻想を打ち砕く
The Devil's Advocate: Shattering the Illusion of Unexploitable Data using Diffusion Models
機械学習モデルの悪用から個人データを保護することは、最も重要です。最近、アベイラビリティ攻撃は、ニューラル ネットワークをトレーニングするためのデータの不正使用に対する追加の保護層を提供する大きな可能性を示しています。これらの方法は、ニューラルネットワークが保護されたデータから意味のあるパターンを抽出できないように、クリーンなデータに知覚できないノイズを追加することを目的としており、個人データを「悪用できない」ようにすることができると主張しています。このホワイト ペーパーでは、このようなアプローチに対する強力な対策を提供し、悪用できないデータは幻想にすぎないことを示します。特に、拡散モデルの力を活用し、慎重に設計されたノイズ除去プロセスがデータ保護摂動の影響を和らげることができることを示します。アルゴリズムを厳密に分析し、必要なノイズ除去の量がデータ保護摂動の大きさに直接関係していることを理論的に証明します。 AVATAR と呼ばれる私たちのアプローチは、さまざまなシナリオで最近の一連の可用性攻撃に対して最先端のパフォーマンスを提供し、敵対的なトレーニングよりも優れています。私たちの調査結果は、個人データを悪用できないようにするためのさらなる研究を必要としており、この目標はまだ終わっていないことを示しています。
Protecting personal data against the exploitation of machine learning models is of paramount importance. Recently, availability attacks have shown great promise to provide an extra layer of protection against the unauthorized use of data to train neural networks. These methods aim to add imperceptible noise to clean data so that the neural networks cannot extract meaningful patterns from the protected data, claiming that they can make personal data "unexploitable." In this paper, we provide a strong countermeasure against such approaches, showing that unexploitable data might only be an illusion. In particular, we leverage the power of diffusion models and show that a carefully designed denoising process can defuse the ramifications of the data-protecting perturbations. We rigorously analyze our algorithm, and theoretically prove that the amount of required denoising is directly related to the magnitude of the data-protecting perturbations. Our approach, called AVATAR, delivers state-of-the-art performance against a suite of recent availability attacks in various scenarios, outperforming adversarial training. Our findings call for more research into making personal data unexploitable, showing that this goal is far from over.
updated: Wed Mar 15 2023 10:20:49 GMT+0000 (UTC)
published: Wed Mar 15 2023 10:20:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト