モノのインターネット(IoT)デバイスとアプリケーションは、家庭や職場で展開されています。これらのデバイスは、多くの場合、機械学習モデルを提供するために継続的なデータ収集に依存しています。ただし、この方法では、サービスオペレーターが利用可能なデータに対して不要な推論を実行できるため、プライバシーと効率に関するいくつかの課題が生じます。最近、エッジ処理の進歩により、単純なタスクとより軽いモデルのソースでのより効率的でプライベートなデータ処理の道が開かれましたが、より大きく、より複雑なモデルの課題は残っています。この論文では、協調的でプライバシーを保護する分析のために、大規模で複雑なディープニューラルネットワークを分解するためのハイブリッドアプローチを示します。このため、クラウドで操作全体を実行する代わりに、IoTデバイスにニューラルネットワークの初期レイヤーを実行させ、クラウドに出力を送信して残りのレイヤーにフィードして最終結果を生成します。ユーザーのデバイスにメインタスクに必要なもの以外の追加情報が含まれないようにし、データの二次推論を防ぐために、シャムの微調整を導入します。クラウドサービスに公開される情報に基づいて、このアプローチのプライバシーの利点を評価します。また、最新のハンドセットのさまざまなレイヤーのローカル推論コストを評価します。私たちの評価では、シャムの微調整をわずかな処理コストで使用することで、個人データ内の不要で潜在的に機密性の高い情報のレベルを大幅に削減できるため、ユーティリティ、プライバシー、パフォーマンスの望ましいトレードオフを達成できることが示されています。
Internet of Things (IoT) devices and applications are being deployed in our homes and workplaces. These devices often rely on continuous data collection to feed machine learning models. However, this approach introduces several privacy and efficiency challenges, as the service operator can perform unwanted inferences on the available data. Recently, advances in edge processing have paved the way for more efficient, and private, data processing at the source for simple tasks and lighter models, though they remain a challenge for larger, and more complicated models. In this paper, we present a hybrid approach for breaking down large, complex deep neural networks for cooperative, privacy-preserving analytics. To this end, instead of performing the whole operation on the cloud, we let an IoT device to run the initial layers of the neural network, and then send the output to the cloud to feed the remaining layers and produce the final result. In order to ensure that the user's device contains no extra information except what is necessary for the main task and preventing any secondary inference on the data, we introduce Siamese fine-tuning. We evaluate the privacy benefits of this approach based on the information exposed to the cloud service. We also assess the local inference cost of different layers on a modern handset. Our evaluations show that by using Siamese fine-tuning and at a small processing cost, we can greatly reduce the level of unnecessary, potentially sensitive information in the personal data, and thus achieving the desired trade-off between utility, privacy, and performance.