arXiv reaDer
Co-Occurrence Matters: 時間的行動局所化のための行動関係の学習
Co-Occurrence Matters: Learning Action Relation for Temporal Action Localization
一時的なアクションのローカリゼーション (TAL) は、その優れたアプリケーションの可能性により、一般的なタスクです。この分野の既存の研究は、主に次の 2 つの弱点に悩まされています。(1) 多くの場合、マルチラベルのケースを無視し、時間モデリングのみに焦点を当てています。 (2) クラスラベルの意味情報を無視し、視覚情報のみを使用します。これらの問題を解決するために、アクション間の共起関係を明示的にモデル化する新しい共起関係モジュール (CORM) を提案します。視覚情報に加えて、クラス ラベルのセマンティック埋め込みをさらに利用して、共起関係をモデル化します。 CORM はプラグ アンド プレイ方式で動作し、既存のシーケンス モデルに簡単に組み込むことができます。視覚的共起と意味共起の両方を考慮することにより、本手法は高いマルチラベル関係モデリング能力を実現します。一方、TAL の既存のデータセットは常に、セマンティック性の低いアトミック アクションに焦点を当てています。したがって、フレーム レベルで UCF-Crime データセットに注釈を付け、さまざまなイベントのセマンティック オーバーラップを考慮することにより、高セマンティック アクションに焦点を当てた挑戦的なマルチラベル データセット UCF-Crime-TAL を構築します。 2 つの一般的に使用される TAL データセット、つまり MultiTHUMOS と TSU に関する広範な実験、および新しく提案された UCF-Crime-TAL は、これらのデータセットで最先端のパフォーマンスを実現する提案された CORM の有効性を示しています。
Temporal action localization (TAL) is a prevailing task due to its great application potential. Existing works in this field mainly suffer from two weaknesses: (1) They often neglect the multi-label case and only focus on temporal modeling. (2) They ignore the semantic information in class labels and only use the visual information. To solve these problems, we propose a novel Co-Occurrence Relation Module (CORM) that explicitly models the co-occurrence relationship between actions. Besides the visual information, it further utilizes the semantic embeddings of class labels to model the co-occurrence relationship. The CORM works in a plug-and-play manner and can be easily incorporated with the existing sequence models. By considering both visual and semantic co-occurrence, our method achieves high multi-label relationship modeling capacity. Meanwhile, existing datasets in TAL always focus on low-semantic atomic actions. Thus we construct a challenging multi-label dataset UCF-Crime-TAL that focuses on high-semantic actions by annotating the UCF-Crime dataset at frame level and considering the semantic overlap of different events. Extensive experiments on two commonly used TAL datasets, i.e., MultiTHUMOS and TSU, and our newly proposed UCF-Crime-TAL demenstrate the effectiveness of the proposed CORM, which achieves state-of-the-art performance on these datasets.
updated: Wed Mar 15 2023 09:07:04 GMT+0000 (UTC)
published: Wed Mar 15 2023 09:07:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト