arXiv reaDer
混乱のない偽装: ユーティリティを維持する顔の匿名化
Disguise without Disruption: Utility-Preserving Face De-Identification
カメラとスマート センサーの普及に伴い、人類は指数関数的な速度でデータを生成しています。多くの場合、まだ過小評価されているユースケース (医療現場での AI など) をカバーするこの情報の山へのアクセスは、新世代の深層学習ツールを促進する可能性があります。ただし、熱心なデータサイエンティストは、これらの未開発のデータセットに存在する個人のプライバシーに関して、満足のいく保証を最初に提供する必要があります。これは、顔が写っている画像や動画の場合、生体情報がほとんどの識別方法の対象となるため、特に重要です。このような画像を匿名化するためのさまざまなソリューションが提案されていますが、ダウンストリーム タスクに関連する他の非識別顔属性が破損することがよくあります。このホワイトペーパーでは、変更されたデータの使いやすさを確保しながら、顔画像をシームレスに匿名化する新しいアルゴリズムである Disguise を提案します。従来技術とは異なり、差分プライバシーとアンサンブル学習の研究領域の両方にソリューションを基盤としています。私たちの方法は、描写されたアイデンティティを抽出して偽のものと交換し、変分メカニズムを介して合成して、難読化と非可逆性を最大化します。専門家の混合からの監督を活用して、他のユーティリティ属性を解きほぐし、保持します。複数のデータセットでこの方法を広く評価し、さまざまなダウンストリーム タスクに関する従来技術よりも高い匿名化率と優れた一貫性を示しています。
With the increasing ubiquity of cameras and smart sensors, humanity is generating data at an exponential rate. Access to this trove of information, often covering yet-underrepresented use-cases (e.g., AI in medical settings) could fuel a new generation of deep-learning tools. However, eager data scientists should first provide satisfying guarantees w.r.t. the privacy of individuals present in these untapped datasets. This is especially important for images or videos depicting faces, as their biometric information is the target of most identification methods. While a variety of solutions have been proposed to de-identify such images, they often corrupt other non-identifying facial attributes that would be relevant for downstream tasks. In this paper, we propose Disguise, a novel algorithm to seamlessly de-identify facial images while ensuring the usability of the altered data. Unlike prior arts, we ground our solution in both differential privacy and ensemble-learning research domains. Our method extracts and swaps depicted identities with fake ones, synthesized via variational mechanisms to maximize obfuscation and non-invertibility; while leveraging the supervision from a mixture-of-experts to disentangle and preserve other utility attributes. We extensively evaluate our method on multiple datasets, demonstrating higher de-identification rate and superior consistency than prior art w.r.t. various downstream tasks.
updated: Thu Mar 23 2023 13:50:46 GMT+0000 (UTC)
published: Thu Mar 23 2023 13:50:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト