arXiv reaDer
DIR-AS: アクション セグメンテーションのための個人識別と時間的推論の分離
DIR-AS: Decoupling Individual Identification and Temporal Reasoning for Action Segmentation
完全に監視されたアクション セグメンテーションは、密な注釈を使用したフレーム単位のアクション認識で機能し、多くの場合、過度のセグメンテーションの問題に悩まされます。既存の研究では、境界認識ネットワーク、多段階の改良、一時的な平滑性の損失など、さまざまなソリューションが提案されています。ただし、それらのほとんどはフレーム単位の監視を利用しているため、さまざまな粒度で評価メトリックに効果的に取り組むことができません。この論文では、望ましい大きな受容野のために、効率的なマルチスケールの注意のための一時的なピラミッド拡張と一時的なピラミッドプーリングを備えた新しいローカルグローバル注意メカニズムを最初に開発しました。次に、アクションのセグメンテーションにおける 2 つの固有の目標、つまり、(1) フレーム単位の監督によって解決される個人の識別、および (2) アクション セット予測によって取り組まれる時間的推論を分離します。その後、アクション アラインメント モジュールがこれらの異なる粒度予測を融合し、より正確でスムーズなアクション セグメンテーションにつながります。 GTEA で 82.8% (+2.6%)、朝食で 74.7% (+1.2%) という最先端の精度を達成しました。コードは後で利用可能になります。
Fully supervised action segmentation works on frame-wise action recognition with dense annotations and often suffers from the over-segmentation issue. Existing works have proposed a variety of solutions such as boundary-aware networks, multi-stage refinement, and temporal smoothness losses. However, most of them take advantage of frame-wise supervision, which cannot effectively tackle the evaluation metrics with different granularities. In this paper, for the desirable large receptive field, we first develop a novel local-global attention mechanism with temporal pyramid dilation and temporal pyramid pooling for efficient multi-scale attention. Then we decouple two inherent goals in action segmentation, ie, (1) individual identification solved by frame-wise supervision, and (2) temporal reasoning tackled by action set prediction. Afterward, an action alignment module fuses these different granularity predictions, leading to more accurate and smoother action segmentation. We achieve state-of-the-art accuracy, eg, 82.8% (+2.6%) on GTEA and 74.7% (+1.2%) on Breakfast, which demonstrates the effectiveness of our proposed method, accompanied by extensive ablation studies. The code will be made available later.
updated: Tue Apr 04 2023 20:27:18 GMT+0000 (UTC)
published: Tue Apr 04 2023 20:27:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト