arXiv reaDer
ゼロショットスケルトンアクション認識のための構文的にガイドされた生成的埋め込み
Syntactically Guided Generative Embeddings for Zero-Shot Skeleton Action Recognition
ゼロショット学習(ZSL)のための新しい構文的にガイドされた生成的アプローチであるSynSEを紹介します。私たちのエンドツーエンドのアプローチは、関連するモダリティ(視覚、言語)内およびモダリティ全体に制約された、徐々に洗練された生成的埋め込みスペースを学習します。インターモーダル制約は、アクションシーケンスの埋め込みと、対応するアクションの説明の品詞(PoS)タグ付き単語の埋め込みとの間に定義されます。スケルトンベースのアクションシーケンス認識のタスクのためにSynSEをデプロイします。私たちの設計上の選択により、SynSEは構成を一般化できます。つまり、アクションの説明にトレーニング中に遭遇しなかった単語が含まれているシーケンスを認識できます。また、信頼性ベースのゲーティングメカニズムを介して、より困難な一般化ゼロショット学習(GZSL)問題へのアプローチを拡張します。複数の分割がある大規模なNTU-60およびNTU-120スケルトンアクションデータセットでゼロショットスケルトンアクション認識結果を初めて提示しました。私たちの結果は、NTU-60およびNTU-120データセットの強力なベースラインと比較して、ZSLおよびGZSL設定の両方でのSynSEの最先端のパフォーマンスを示しています。コードと事前トレーニング済みモデルは、https://github.com/skelemoa/synse-zslで入手できます。
We introduce SynSE, a novel syntactically guided generative approach for Zero-Shot Learning (ZSL). Our end-to-end approach learns progressively refined generative embedding spaces constrained within and across the involved modalities (visual, language). The inter-modal constraints are defined between action sequence embedding and embeddings of Parts of Speech (PoS) tagged words in the corresponding action description. We deploy SynSE for the task of skeleton-based action sequence recognition. Our design choices enable SynSE to generalize compositionally, i.e., recognize sequences whose action descriptions contain words not encountered during training. We also extend our approach to the more challenging Generalized Zero-Shot Learning (GZSL) problem via a confidence-based gating mechanism. We are the first to present zero-shot skeleton action recognition results on the large-scale NTU-60 and NTU-120 skeleton action datasets with multiple splits. Our results demonstrate SynSE's state of the art performance in both ZSL and GZSL settings compared to strong baselines on the NTU-60 and NTU-120 datasets. The code and pretrained models are available at https://github.com/skelemoa/synse-zsl
updated: Mon Jun 28 2021 23:59:56 GMT+0000 (UTC)
published: Wed Jan 27 2021 16:34:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト