arXiv reaDer
弱教師あり時間的アクションローカリゼーションのポイントからアクションの完全性を学習する
Learning Action Completeness from Points for Weakly-supervised Temporal Action Localization
トレーニング用のアクションインスタンスごとに1つのフレームラベルのみを使用して、アクションの時間間隔をローカライズする問題に取り組みます。ラベルの希薄性のために、既存の作業はアクションの完全性を学習できず、断片的なアクション予測が発生します。この論文では、モデルの完全性ガイダンスを提供するために高密度の疑似ラベルが生成される新しいフレームワークを提案します。具体的には、まず疑似背景ポイントを選択して、ポイントレベルのアクションラベルを補足します。次に、ポイントをシードとして、シードに同意しながら、完全なアクションインスタンスを含む可能性が高い最適なシーケンスを検索します。得られたシーケンスから完全性を学習するために、アクションスコアと機能の類似性の観点からアクションインスタンスとバックグラウンドインスタンスをそれぞれ対比する2つの新しい損失を紹介します。実験結果は、完全性ガイダンスが実際にモデルが完全なアクションインスタンスを見つけるのに役立ち、特に高いIoUしきい値の下で大幅なパフォーマンスの向上につながることを示しています。さらに、THUMOS'14、GTEA、BEOID、ActivityNetの4つのベンチマークで、既存の最先端の手法よりも優れていることを示しています。特に、私たちの方法は、6倍安い注釈コストで、最近の完全に監視された方法と同等のパフォーマンスを発揮します。私たちのコードはhttps://github.com/Pilhyeonで入手できます。
We tackle the problem of localizing temporal intervals of actions with only a single frame label for each action instance for training. Owing to label sparsity, existing work fails to learn action completeness, resulting in fragmentary action predictions. In this paper, we propose a novel framework, where dense pseudo-labels are generated to provide completeness guidance for the model. Concretely, we first select pseudo background points to supplement point-level action labels. Then, by taking the points as seeds, we search for the optimal sequence that is likely to contain complete action instances while agreeing with the seeds. To learn completeness from the obtained sequence, we introduce two novel losses that contrast action instances with background ones in terms of action score and feature similarity, respectively. Experimental results demonstrate that our completeness guidance indeed helps the model to locate complete action instances, leading to large performance gains especially under high IoU thresholds. Moreover, we demonstrate the superiority of our method over existing state-of-the-art methods on four benchmarks: THUMOS'14, GTEA, BEOID, and ActivityNet. Notably, our method even performs comparably to recent fully-supervised methods, at the 6 times cheaper annotation cost. Our code is available at https://github.com/Pilhyeon.
updated: Wed Aug 11 2021 04:54:39 GMT+0000 (UTC)
published: Wed Aug 11 2021 04:54:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト