arXiv reaDer
MIST:ビデオ異常検出のためのマルチインスタンスセルフトレーニングフレームワーク
MIST: Multiple Instance Self-Training Framework for Video Anomaly Detection
弱く監視されたビデオ異常検出(WS-VAD)は、識別表現に基づいて異常を通常のイベントから区別することです。ほとんどの既存の作品は、不十分なビデオ表現に制限されています。この作業では、複数インスタンスの自己トレーニングフレームワーク(MIST)を開発して、ビデオレベルの注釈のみを使用してタスク固有の識別表現を効率的に改良します。特に、MISTは、1)スパース連続サンプリング戦略を採用してより信頼性の高いクリップレベルの疑似ラベルを生成するマルチインスタンス疑似ラベルジェネレーター、および2)自動的に焦点を合わせる目的の自己誘導型アテンションブースト機能エンコーダーで構成されます。タスク固有の表現を抽出する際のフレーム内の異常な領域。さらに、セルフトレーニングスキームを採用して両方のコンポーネントを最適化し、最終的にタスク固有の機能エンコーダーを取得します。 2つの公開データセットでの広範な実験により、この方法の有効性が実証されました。この方法は、既存の教師ありおよび弱教師ありの方法と同等またはそれ以上のパフォーマンスを発揮し、特に上海科技大学でフレームレベルのAUC 94.83%を取得します。
Weakly supervised video anomaly detection (WS-VAD) is to distinguish anomalies from normal events based on discriminative representations. Most existing works are limited in insufficient video representations. In this work, we develop a multiple instance self-training framework (MIST)to efficiently refine task-specific discriminative representations with only video-level annotations. In particular, MIST is composed of 1) a multiple instance pseudo label generator, which adapts a sparse continuous sampling strategy to produce more reliable clip-level pseudo labels, and 2) a self-guided attention boosted feature encoder that aims to automatically focus on anomalous regions in frames while extracting task-specific representations. Moreover, we adopt a self-training scheme to optimize both components and finally obtain a task-specific feature encoder. Extensive experiments on two public datasets demonstrate the efficacy of our method, and our method performs comparably to or even better than existing supervised and weakly supervised methods, specifically obtaining a frame-level AUC 94.83% on ShanghaiTech.
updated: Sun Apr 04 2021 15:47:14 GMT+0000 (UTC)
published: Sun Apr 04 2021 15:47:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト