arXiv reaDer
骨格ビデオ異常検出のための明示的分布モデリングによる規則性学習
Regularity Learning via Explicit Distribution Modeling for Skeletal Video Anomaly Detection
監視ビデオでの異常検出は、公共のセキュリティを確保するために困難で重要です。ピクセルベースの異常検出方法とは異なり、ポーズベースの方法は高度に構造化されたスケルトンデータを利用するため、計算負荷が軽減され、バックグラウンドノイズの悪影響も回避されます。ただし、オプティカルフローなどの明示的なモーション機能を直接利用できるピクセルベースの方法とは異なり、ポーズベースの方法には代替の動的表現がないという欠点があります。本論文では、確率の観点からポーズモーション表現を提供するために、新しいモーションエンベダー(ME)を提案した。さらに、新しいタスク固有の時空間トランスフォーマー(STT)は、自己監視ポーズシーケンスの再構築のために展開されます。これらの2つのモジュールは、ポーズの規則性学習のための統合フレームワークに統合されます。これは、モーション事前規則性学習者(MoPRL)と呼ばれます。 MoPRLは、いくつかの困難なデータセットで平均4.7%AUCの改善により、最先端のパフォーマンスを実現します。広範な実験により、提案された各モジュールの多様性が検証されます。
Anomaly detection in surveillance videos is challenging and important for ensuring public security. Different from pixel-based anomaly detection methods, pose-based methods utilize highly-structured skeleton data, which decreases the computational burden and also avoids the negative impact of background noise. However, unlike pixel-based methods, which could directly exploit explicit motion features such as optical flow, pose-based methods suffer from the lack of alternative dynamic representation. In this paper, a novel Motion Embedder (ME) is proposed to provide a pose motion representation from the probability perspective. Furthermore, a novel task-specific Spatial-Temporal Transformer (STT) is deployed for self-supervised pose sequence reconstruction. These two modules are then integrated into a unified framework for pose regularity learning, which is referred to as Motion Prior Regularity Learner (MoPRL). MoPRL achieves the state-of-the-art performance by an average improvement of 4.7% AUC on several challenging datasets. Extensive experiments validate the versatility of each proposed module.
updated: Wed Dec 08 2021 04:34:47 GMT+0000 (UTC)
published: Tue Dec 07 2021 11:52:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト