監視ビデオでの異常検出は、コンピュータビジョンにおける重要な研究課題です。本論文では、異常検出ネットワークであるADNetを提案します。これは、時間畳み込みを利用してビデオの異常をローカライズします。モデルは、固定数のビデオクリップで構成される連続したウィンドウを受け入れることによってオンラインで機能します。ウィンドウ内のビデオクリップから抽出された特徴はADNetに送られ、ビデオの異常を効果的にローカライズできます。 ADNetの異常セグメント検出性能を向上させるためのAD損失関数を提案します。さらに、時間的異常検出にF1 @kメトリックを使用することを提案します。 F1 @ kは、時間セグメントのマイナーシフトにペナルティを課さず、短い誤検出の時間セグメント予測を罰するという点で、AUCよりも優れた評価指標です。さらに、さらに2つの異常クラスを追加し、すべてのクラスに一時的な異常アノテーションを提供することで、UCF犯罪データセットを拡張します。最後に、拡張UCF犯罪データセットでモデルを徹底的に評価します。 ADNetは、F1 @kメトリックに関して有望な結果を生成します。データセットの拡張機能とコードは、公開時に公開されます
Anomaly detection in surveillance videos is an important research problem in computer vision. In this paper, we propose ADNet, an anomaly detection network, which utilizes temporal convolutions to localize anomalies in videos. The model works online by accepting consecutive windows consisting of fixed-number of video clips. Features extracted from video clips in a window are fed to ADNet, which allows to localize anomalies in videos effectively. We propose the AD Loss function to improve abnormal segment detection performance of ADNet. Additionally, we propose to use F1@k metric for temporal anomaly detection. F1@k is a better evaluation metric than AUC in terms of not penalizing minor shifts in temporal segments and punishing short false positive temporal segment predictions. Furthermore, we extend UCF Crime dataset by adding two more anomaly classes and providing temporal anomaly annotations for all classes. Finally, we thoroughly evaluate our model on the extended UCF Crime dataset. ADNet produces promising results with respect to F1@k metric. Dataset extensions and code will be publicly available upon publishing