このホワイトペーパーでは、ビデオ監視のビデオ異常検出の問題について説明します。異常なイベントの固有の希少性と不均一性のために、問題は、トレーニング中に異常なサンプルを見ることなく、モデルがオブジェクト中心の正常なパターンを学習する正常性モデリング戦略と見なされます。主な貢献は、事前に訓練されたオブジェクトレベルのアクション機能のプロトタイプを余弦距離ベースの異常推定関数と結合することであり、したがって、主流の再構築ベースの戦略に追加の制約を導入することによって以前の方法を拡張します。私たちのフレームワークは、外観と動きの両方の情報を活用して、オブジェクトレベルの動作を学習し、メモリモジュール内の典型的なパターンをキャプチャします。いくつかのよく知られたデータセットでの実験は、最も関連性のある時空間評価メトリックで現在の最先端を上回っているため、私たちの方法の有効性を示しています。
This paper addresses video anomaly detection problem for videosurveillance. Due to the inherent rarity and heterogeneity of abnormal events, the problem is viewed as a normality modeling strategy, in which our model learns object-centric normal patterns without seeing anomalous samples during training. The main contributions consist in coupling pretrained object-level action features prototypes with a cosine distance-based anomaly estimation function, therefore extending previous methods by introducing additional constraints to the mainstream reconstruction-based strategy. Our framework leverages both appearance and motion information to learn object-level behavior and captures prototypical patterns within a memory module. Experiments on several well-known datasets demonstrate the effectiveness of our method as it outperforms current state-of-the-art on most relevant spatio-temporal evaluation metrics.