arXiv reaDer
STPrivacy: プライバシー保護アクション認識のための時空間細管スパース化と匿名化
STPrivacy: Spatio-Temporal Tubelet Sparsification and Anonymization for Privacy-preserving Action Recognition
最近、プライバシー保護行動認識 (PPAR) が魅力的なビデオ理解問題になりつつあります。それにもかかわらず、既存の作品はフレーム レベル (空間) のプライバシー保護に焦点を当てており、ビデオ全体からのプライバシーの漏洩を無視し、アクションの時間的な連続性を破壊しています。この論文では、新しい PPAR パラダイム、つまり、空間的および時間的観点からプライバシー保護を実行することを提示し、STPrivacy フレームワークを提案します。 STPrivacy は、ビジョン トランスフォーマーを PPAR に初めて適用し、ビデオを時空間チューブレットのシーケンスと見なし、以前の畳み込み方法よりも優れた利点を示します。具体的には、当社の STPrivacy は、プライバシーを含むチューブレットを 2 つの異なる方法で適応的に扱います。アクションに関係のないチューブレットは、直接放棄されます。つまり、スパース化され、後続のタスクのために公開されません。反対に、活動に深く関わっている人は、個人情報を取り除くために匿名化、つまり匿名化されます。これら 2 つの変換メカニズムは補完的であり、統合されたフレームワークで同時に最適化されます。大規模なベンチマークがないため、最も人気のある 2 つのアクション認識データセット、つまり HMDB51 と UCF101 の 5 つのプライバシー属性に注釈を付け、それらに対して広範な実験を行います。さらに、STPrivacy の一般化能力を検証するために、プライバシーを保護する表情認識タスクをさらに導入し、大規模なビデオ顔属性データセット、すなわち Celeb-VHQ で実験を行います。徹底的な比較と視覚化分析により、既存の作品に対する当社の優れた優位性が実証されています。付録には、詳細と視覚化が含まれています。
Recently privacy-preserving action recognition (PPAR) has been becoming an appealing video understanding problem. Nevertheless, existing works focus on the frame-level (spatial) privacy preservation, ignoring the privacy leakage from a whole video and destroying the temporal continuity of actions. In this paper, we present a novel PPAR paradigm, i.e., performing privacy preservation from both spatial and temporal perspectives, and propose a STPrivacy framework. For the first time, our STPrivacy applies vision Transformers to PPAR and regards a video as a sequence of spatio-temporal tubelets, showing outstanding advantages over previous convolutional methods. Specifically, our STPrivacy adaptively treats privacy-containing tubelets in two different manners. The tubelets irrelevant to actions are directly abandoned, i.e., sparsification, and not published for subsequent tasks. In contrast, those highly involved in actions are anonymized, i.e., anonymization, to remove private information. These two transformation mechanisms are complementary and simultaneously optimized in our unified framework. Because there is no large-scale benchmarks, we annotate five privacy attributes for two of the most popular action recognition datasets, i.e., HMDB51 and UCF101, and conduct extensive experiments on them. Moreover, to verify the generalization ability of our STPrivacy, we further introduce a privacy-preserving facial expression recognition task and conduct experiments on a large-scale video facial attributes dataset, i.e., Celeb-VHQ. The thorough comparisons and visualization analysis demonstrate our significant superiority over existing works. The appendix contains more details and visualizations.
updated: Sun Jan 08 2023 14:07:54 GMT+0000 (UTC)
published: Sun Jan 08 2023 14:07:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト