Global Information Guided Video Anomaly Detection
ビデオ異常検出(VAD)は、異常の複雑さと労働集約的な時間的注釈の欠如のために、現在困難な作業です。この論文では、ビデオレベルの注釈(つまり、弱いラベル)を使用した異常検出のためのエンドツーエンドのグローバル情報ガイド(GIG)異常検出フレームワークを提案します。まず、GIGモジュールの弱いラベルを活用して、グローバルパターンの手がかりをマイニングすることを提案します。次に、空間推論モジュールを構築して、空間ドメイン内のベクトルとグローバルキューベクトルとの関連性を測定し、時間的異常検出のために最も関連性の高い特徴ベクトルを選択します。 CitySceneチャレンジの実験結果は、モデルの有効性を示しています。
Video anomaly detection (VAD) is currently a challenging task due to the complexity of anomaly as well as the lack of labor-intensive temporal annotations. In this paper, we propose an end-to-end Global Information Guided (GIG) anomaly detection framework for anomaly detection using the video-level annotations (i.e., weak labels). We propose to first mine the global pattern cues by leveraging the weak labels in a GIG module. Then we build a spatial reasoning module to measure the relevance between vectors in spatial domain with the global cue vectors, and select the most related feature vectors for temporal anomaly detection. The experimental results on the CityScene challenge demonstrate the effectiveness of our model.
updated: Wed Apr 14 2021 12:32:13 GMT+0000 (UTC)
published: Wed Apr 14 2021 12:32:13 GMT+0000 (UTC)
