arXiv reaDer
人間の動作認識のための人間解析とポーズ ネットワークの統合
Integrating Human Parsing and Pose Network for Human Action Recognition
人間の骨格と RGB シーケンスはどちらも、人間の動作を認識するために広く採用されている入力モダリティです。しかし、スケルトンには外観上の特徴が欠けており、色データには大量の無関係な描写が発生します。これに対処するために、私たちは新しいモダリティとして人間解析特徴マップを導入します。これは、服装や背景などに関するノイズをフィルタリングしながら、身体部分の時空間的特徴を選択的に保持できるためです。私たちは、統合人間解析およびポーズ ネットワーク (IPP- Net) は、アクション認識に使用されます。これは、デュアルブランチ アプローチでスケルトンと人間の解析特徴マップの両方を初めて利用します。ヒューマン ポーズ ブランチは、グラフ畳み込みネットワーク内のさまざまなモダリティのコンパクトな骨格表現をモデルのポーズ特徴に供給します。人間解析ブランチでは、人間検出器とパーサーを使用してマルチフレームの身体部分解析特徴が抽出され、後で畳み込みバックボーンを使用して学習されます。堅牢なキーポイントと豊富なセマンティックな本体部分の特徴の両方を考慮して、2 つのブランチの後期アンサンブルを採用して最終予測を取得します。 NTU RGB+D および NTU RGB+D 120 ベン​​チマークに関する広範な実験により、提案された IPP-Net の有効性が一貫して検証され、既存の動作認識方法よりも優れた性能を発揮します。私たちのコードは https://github.com/liujf69/IPP-Net-Parsing で公開されています。
Human skeletons and RGB sequences are both widely-adopted input modalities for human action recognition. However, skeletons lack appearance features and color data suffer large amount of irrelevant depiction. To address this, we introduce human parsing feature map as a novel modality, since it can selectively retain spatiotemporal features of the body parts, while filtering out noises regarding outfits, backgrounds, etc. We propose an Integrating Human Parsing and Pose Network (IPP-Net) for action recognition, which is the first to leverage both skeletons and human parsing feature maps in dual-branch approach. The human pose branch feeds compact skeletal representations of different modalities in graph convolutional network to model pose features. In human parsing branch, multi-frame body-part parsing features are extracted with human detector and parser, which is later learnt using a convolutional backbone. A late ensemble of two branches is adopted to get final predictions, considering both robust keypoints and rich semantic body-part features. Extensive experiments on NTU RGB+D and NTU RGB+D 120 benchmarks consistently verify the effectiveness of the proposed IPP-Net, which outperforms the existing action recognition methods. Our code is publicly available at https://github.com/liujf69/IPP-Net-Parsing .
updated: Sun Jul 16 2023 07:58:29 GMT+0000 (UTC)
published: Sun Jul 16 2023 07:58:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト