Appleは最近、ファイルがiCloudサービスにアップロードされる前に、ユーザーデバイス上の児童の性的虐待資料(CSAM)を検出するためのディープ知覚ハッシュシステムNeuralHashを発表しました。ユーザーのプライバシーの保護とシステムの信頼性に関して、すぐに世間の批判が起こりました。この論文では、NeuralHashに基づく深い知覚ハッシュの最初の包括的な経験的分析を提示します。具体的には、現在の深い知覚ハッシュが堅牢ではない可能性があることを示します。攻撃者は、勾配ベースのアプローチによって、または単に標準の画像変換を実行してハッシュの衝突を強制または防止することによって、画像にわずかな変更を適用することにより、ハッシュ値を操作できます。このような攻撃により、悪意のある攻撃者は検出システムを簡単に悪用できます。不正なコンテンツの隠蔽から無実のユーザーのフレーミングまで、すべてが可能です。さらに、ハッシュ値を使用して、ユーザーデバイスに保存されているデータについて推論を行うことができます。私たちの見解では、私たちの結果に基づいて、現在の形式の深い知覚ハッシュは、一般に堅牢なクライアント側スキャンの準備ができておらず、プライバシーの観点から使用すべきではありません。
Apple recently revealed its deep perceptual hashing system NeuralHash to detect child sexual abuse material (CSAM) on user devices before files are uploaded to its iCloud service. Public criticism quickly arose regarding the protection of user privacy and the system's reliability. In this paper, we present the first comprehensive empirical analysis of deep perceptual hashing based on NeuralHash. Specifically, we show that current deep perceptual hashing may not be robust. An adversary can manipulate the hash values by applying slight changes in images, either induced by gradient-based approaches or simply by performing standard image transformations, forcing or preventing hash collisions. Such attacks permit malicious actors easily to exploit the detection system: from hiding abusive material to framing innocent users, everything is possible. Moreover, using the hash values, inferences can still be made about the data stored on user devices. In our view, based on our results, deep perceptual hashing in its current form is generally not ready for robust client-side scanning and should not be used from a privacy perspective.