arXiv reaDer
階層的アトミックアクションを伴うきめの細かいビデオの弱く監視された時間的アクション検出
Weakly-Supervised Temporal Action Detection for Fine-Grained Videos with Hierarchical Atomic Actions
実生活でのほとんどの人間の行動にはわずかな違いしかないため、行動の理解は細かい粒度の時代に進化しました。これらのきめ細かいアクションをラベル効率の高い方法で正確に検出するために、ビデオでの弱く監視されたきめ細かい時間的アクション検出の問題に初めて取り組みます。きめ細かいアクション間の微妙な違いをキャプチャするための注意深い設計がなければ、一般的なアクション検出のための以前の弱く監視されたモデルは、きめ細かい設定ではうまく機能しません。きめ細かいアクションの共通性と個性を捉えるために、自己監視クラスタリングを通じてデータから自動的に検出される再利用可能なアトミックアクションの組み合わせとしてアクションをモデル化することを提案します。視覚的な概念によって表される学習されたアトミックアクションは、セマンティックラベル階層を活用して、細かいアクションラベルと粗いアクションラベルにさらにマッピングされます。私たちのアプローチは、クリップレベル、アトミックアクションレベル、ファインアクションクラスレベル、コースアクションクラスレベルの4つのレベルの視覚的表現階層を構築し、各レベルで監視します。 2つの大規模なきめの細かいビデオデータセット、FineActionとFineGymでの広範な実験は、きめの細かいアクション検出のために提案された弱く監視されたモデルの利点を示し、最先端の結果を達成します。
Action understanding has evolved into the era of fine granularity, as most human behaviors in real life have only minor differences. To detect these fine-grained actions accurately in a label-efficient way, we tackle the problem of weakly-supervised fine-grained temporal action detection in videos for the first time. Without the careful design to capture subtle differences between fine-grained actions, previous weakly-supervised models for general action detection cannot perform well in the fine-grained setting. We propose to model actions as the combinations of reusable atomic actions which are automatically discovered from data through self-supervised clustering, in order to capture the commonality and individuality of fine-grained actions. The learnt atomic actions, represented by visual concepts, are further mapped to fine and coarse action labels leveraging the semantic label hierarchy. Our approach constructs a visual representation hierarchy of four levels: clip level, atomic action level, fine action class level and coarse action class level, with supervision at each level. Extensive experiments on two large-scale fine-grained video datasets, FineAction and FineGym, show the benefit of our proposed weakly-supervised model for fine-grained action detection, and it achieves state-of-the-art results.
updated: Sun Jul 24 2022 20:32:24 GMT+0000 (UTC)
published: Sun Jul 24 2022 20:32:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト