このペーパーは、独自の敵対的トレーニングフレームワークを策定することにより、スマートカメラアプリケーションでますます要求される機能であるプライバシー保護の視覚認識を改善することを目的としています。提案されたフレームワークは、ターゲットタスクのパフォーマンスと劣化したビデオの関連するプライバシーバジェットとの間のトレードオフを最適化するために、元のビデオ入力の劣化変換を明示的に学習します。注目すべき課題は、プライバシー情報をハッキングしようとする可能性のあるモデルに対してプライバシーの強力な保護を維持する必要があるため、タスク駆動型のコンテキストで定義および測定されることが多いプライバシーバジェットを単一のモデルパフォーマンスを使用して確実に示すことができないことです。このような珍しい状況は、目に見えないハッカーモデルからプライバシーを保護する上で学習した劣化の一般化を強化するために、2つの戦略、つまり予算モデルの再開とアンサンブルを提案する動機になりました。それに応じて、新しいトレーニング戦略、評価プロトコル、および結果の視覚化方法が設計されています。プライバシー予算がさまざまな方法で定義されたプライバシー保護行動認識に関する2つの実験は、プライバシー侵害のリスクを抑制しながら、高いターゲットタスク(行動認識)パフォーマンスを同時に維持するという提案されたフレームワークの説得力のある有効性を示しています。
This paper aims to improve privacy-preserving visual recognition, an increasingly demanded feature in smart camera applications, by formulating a unique adversarial training framework. The proposed framework explicitly learns a degradation transform for the original video inputs, in order to optimize the trade-off between target task performance and the associated privacy budgets on the degraded video. A notable challenge is that the privacy budget, often defined and measured in task-driven contexts, cannot be reliably indicated using any single model performance, because a strong protection of privacy has to sustain against any possible model that tries to hack privacy information. Such an uncommon situation has motivated us to propose two strategies, i.e., budget model restarting and ensemble, to enhance the generalization of the learned degradation on protecting privacy against unseen hacker models. Novel training strategies, evaluation protocols, and result visualization methods have been designed accordingly. Two experiments on privacy-preserving action recognition, with privacy budgets defined in various ways, manifest the compelling effectiveness of the proposed framework in simultaneously maintaining high target task (action recognition) performance while suppressing the privacy breach risk.