arXiv reaDer
不確実性モデリングによる弱教師あり時間的アクションのローカリゼーション
Weakly-supervised Temporal Action Localization by Uncertainty Modeling
弱教師あり時間アクションローカリゼーションは、ビデオレベルのラベルのみを使用してアクションクラスの時間間隔を検出することを学習することを目的としています。このためには、アクションクラスのフレームをバックグラウンドフレーム(つまり、どのアクションクラスにも属していないフレーム)から分離することが重要です。この論文では、背景フレームが不整合に関して分布外のサンプルとしてモデル化されている場合の新しい視点を示します。次に、不確実性と呼ばれる、各フレームが分布外になる確率を推定することで背景フレームを検出できますが、フレームレベルのラベルなしで不確実性を直接学習することは不可能です。弱教師あり設定での不確実性学習を実現するために、複数インスタンス学習の定式化を活用します。さらに、バックグラウンドエントロピー損失を導入して、バックグラウンドフレームをより適切に区別するために、それらの分布内(アクション)確率がすべてのアクションクラスに均一に分散されるようにします。実験結果は、不確実性モデリングがバックグラウンドフレームの干渉を軽減するのに効果的であり、ベルやホイッスルなしで大幅なパフォーマンスの向上をもたらすことを示しています。私たちのモデルは、ベンチマークであるTHUMOS'14およびActivityNet(1.2および1.3)の最先端の方法を大幅に上回っていることを示しています。私たちのコードはhttps://github.com/Pilhyeon/WTAL-Uncertainty-Modelingで入手できます。
Weakly-supervised temporal action localization aims to learn detecting temporal intervals of action classes with only video-level labels. To this end, it is crucial to separate frames of action classes from the background frames (i.e., frames not belonging to any action classes). In this paper, we present a new perspective on background frames where they are modeled as out-of-distribution samples regarding their inconsistency. Then, background frames can be detected by estimating the probability of each frame being out-of-distribution, known as uncertainty, but it is infeasible to directly learn uncertainty without frame-level labels. To realize the uncertainty learning in the weakly-supervised setting, we leverage the multiple instance learning formulation. Moreover, we further introduce a background entropy loss to better discriminate background frames by encouraging their in-distribution (action) probabilities to be uniformly distributed over all action classes. Experimental results show that our uncertainty modeling is effective at alleviating the interference of background frames and brings a large performance gain without bells and whistles. We demonstrate that our model significantly outperforms state-of-the-art methods on the benchmarks, THUMOS'14 and ActivityNet (1.2 & 1.3). Our code is available at https://github.com/Pilhyeon/WTAL-Uncertainty-Modeling.
updated: Mon Dec 14 2020 07:39:30 GMT+0000 (UTC)
published: Fri Jun 12 2020 08:54:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト