arXiv reaDer
IPProtect: データ評価中のビジュアル データセットの知的財産の保護
IPProtect: protecting the intellectual property of visual datasets during data valuation
データ駆動型の機械学習パイプラインの開発を加速するには、データ取引が不可欠です。データ取引の中心的な問題は、特定の買い手の機械学習タスク (データ評価とも呼ばれます) に対する売り手のデータセットの有用性を推定することです。通常、データ評価では、1 人または複数の参加者が未加工のデータセットを他のユーザーと共有する必要があり、知的財産 (IP) 侵害の潜在的なリスクにつながります。このホワイト ペーパーでは、データ評価中に共有する必要があるデータセットの IP を先制的に保護するという新しいタスクに取り組みます。まず、ビジュアル データセットで 2 種類の新しい IP リスクを特定して形式化します。データ項目 (画像) IP と統計 (データセット) IP です。次に、生のデータセットを無害化されたバージョンに変換する新しいアルゴリズムを提案します。これは、IP 違反に対する耐性を提供すると同時に、正確なデータ評価を可能にします。重要なアイデアは、未加工のデータセットから無害化されたデータセットへの情報の転送を制限し、それによって潜在的な知的財産侵害から保護することです。次に、ソリューションの存在可能性と再構築攻撃に対する耐性について、メソッドを分析します。最後に、3 つのコンピューター ビジョン データセットに対して大規模な実験を行い、他のベースラインと比較してこの方法の利点を示します。
Data trading is essential to accelerate the development of data-driven machine learning pipelines. The central problem in data trading is to estimate the utility of a seller's dataset with respect to a given buyer's machine learning task, also known as data valuation. Typically, data valuation requires one or more participants to share their raw dataset with others, leading to potential risks of intellectual property (IP) violations. In this paper, we tackle the novel task of preemptively protecting the IP of datasets that need to be shared during data valuation. First, we identify and formalize two kinds of novel IP risks in visual datasets: data-item (image) IP and statistical (dataset) IP. Then, we propose a novel algorithm to convert the raw dataset into a sanitized version, that provides resistance to IP violations, while at the same time allowing accurate data valuation. The key idea is to limit the transfer of information from the raw dataset to the sanitized dataset, thereby protecting against potential intellectual property violations. Next, we analyze our method for the likely existence of a solution and immunity against reconstruction attacks. Finally, we conduct extensive experiments on three computer vision datasets demonstrating the advantages of our method in comparison to other baselines.
updated: Thu Dec 22 2022 03:36:19 GMT+0000 (UTC)
published: Thu Dec 22 2022 03:36:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト