arXiv reaDer
正規性の利点と自己ペースの改善によるラベルのないビデオからの深い異常の発見
Deep Anomaly Discovery From Unlabeled Videos via Normality Advantage and Self-Paced Refinement
従来のビデオ異常検出(VAD)では、トレーニングにラベル付きの通常のビデオが必要ですが、新しい教師なしVAD(UVAD)は、完全にラベルのないビデオから直接異常を検出することを目的としています。ただし、既存のUVADメソッドは、検出または初期化を実行するために浅いモデルに依然依存しており、従来のVADメソッドよりも明らかに劣っています。この論文は、非常に効果的なUVADを実現できる完全なディープニューラルネットワーク(DNN)ベースのソリューションを提案します。まず、深い再構成がUVADに驚くほど効果的である可能性があることを初めて指摘します。これにより、「正常性の利点」という名前のプロパティが明らかになります。つまり、DNNがラベルのない動画の再構成を学習すると、通常のイベントでは再構成の損失が少なくなります。 。この特性により、ローカリゼーションベースの再構築(LBR)を、強力なUVADベースラインおよびソリューションの強固な基盤として提案します。次に、UVADを実行するためにLBRに合成される新しいセルフペースリファインメント(SPR)スキームを提案します。より多くのサンプルを簡単に難しい方法で注入する通常の自己ペース学習とは異なり、提案されたSPRスキームは、疑わしい異常を学習プロセスから取り除くことができるように、サンプルを徐々にドロップします。このようにして、SPRは正規性の利点を統合し、より積極的な方法でより優れたUVADを可能にします。最後に、モーションキューを明示的に考慮したバリアントソリューションをさらに設計します。このソリューションは明らかにUVADのパフォーマンスを向上させ、時には最高の古典的なVADメソッドを超えることさえあります。実験によると、私たちのソリューションは、既存のUVADメソッドを大幅に上回っているだけでなく(5%から9%AUROC)、UVADが従来のVADの主流のパフォーマンスに追いつくこともできます。
While classic video anomaly detection (VAD) requires labeled normal videos for training, emerging unsupervised VAD (UVAD) aims to discover anomalies directly from fully unlabeled videos. However, existing UVAD methods still rely on shallow models to perform detection or initialization, and they are evidently inferior to classic VAD methods. This paper proposes a full deep neural network (DNN) based solution that can realize highly effective UVAD. First, we, for the first time, point out that deep reconstruction can be surprisingly effective for UVAD, which inspires us to unveil a property named "normality advantage", i.e., normal events will enjoy lower reconstruction loss when DNN learns to reconstruct unlabeled videos. With this property, we propose Localization based Reconstruction (LBR) as a strong UVAD baseline and a solid foundation of our solution. Second, we propose a novel self-paced refinement (SPR) scheme, which is synthesized into LBR to conduct UVAD. Unlike ordinary self-paced learning that injects more samples in an easy-to-hard manner, the proposed SPR scheme gradually drops samples so that suspicious anomalies can be removed from the learning process. In this way, SPR consolidates normality advantage and enables better UVAD in a more proactive way. Finally, we further design a variant solution that explicitly takes the motion cues into account. The solution evidently enhances the UVAD performance, and it sometimes even surpasses the best classic VAD methods. Experiments show that our solution not only significantly outperforms existing UVAD methods by a wide margin (5% to 9% AUROC), but also enables UVAD to catch up with the mainstream performance of classic VAD.
updated: Tue Jun 21 2022 08:09:00 GMT+0000 (UTC)
published: Wed Aug 04 2021 11:31:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト