3Dスケルトンを介した個人の再識別は、セキュリティが重要なアプリケーションで大きな可能性を秘めた新たなトピックです。既存の方法は通常、体と関節の軌道から体と動きの特徴を学習しますが、体の構造と体の関節のスケールを超えた体の構成要素の基本的な関係をモデル化する体系的な方法がありません。本論文では、効果的なスケルトンを学習するために、さまざまなスケールのラベルなしスケルトングラフから人体、コンポーネントの関係、およびスケルトンダイナミクスを包括的にモデル化する自己監視マルチスケールスケルトングラフエンコーディング(SM-SGE)フレームワークを初めて提案します。人のRe-IDの表現。具体的には、まず、人体の粗いパーティションから細かいパーティションまでのマルチスケールのスケルトングラフを考案します。これにより、複数のレベルで体の構造とスケルトンのダイナミクスをモデル化できます。第二に、骨格運動における身体成分間の固有の相関関係をマイニングするために、隣接する身体成分ノード間の構造的関係および異なるスケールのノード間の協調関係を学習するマルチスケールグラフ関係ネットワークを提案し、より識別力のある骨格グラフの特徴をキャプチャします。最後に、フレームワークがラベルのないスケルトングラフからスケルトンダイナミクスと高レベルのセマンティクスをエンコードできるようにする新しいマルチスケールスケルトン再構築メカニズムを提案します。これにより、人物Re-IDの識別スケルトン表現の学習が促進されます。広範な実験により、SM-SGEはほとんどの最先端のスケルトンベースの方法よりも優れていることが示されています。さらに、大規模なRGBビデオから推定された3Dスケルトンデータに対するその有効性を示します。私たちのコードはhttps://github.com/Kali-Hac/SM-SGEで公開されています。
Person re-identification via 3D skeletons is an emerging topic with great potential in security-critical applications. Existing methods typically learn body and motion features from the body-joint trajectory, whereas they lack a systematic way to model body structure and underlying relations of body components beyond the scale of body joints. In this paper, we for the first time propose a Self-supervised Multi-scale Skeleton Graph Encoding (SM-SGE) framework that comprehensively models human body, component relations, and skeleton dynamics from unlabeled skeleton graphs of various scales to learn an effective skeleton representation for person Re-ID. Specifically, we first devise multi-scale skeleton graphs with coarse-to-fine human body partitions, which enables us to model body structure and skeleton dynamics at multiple levels. Second, to mine inherent correlations between body components in skeletal motion, we propose a multi-scale graph relation network to learn structural relations between adjacent body-component nodes and collaborative relations among nodes of different scales, so as to capture more discriminative skeleton graph features. Last, we propose a novel multi-scale skeleton reconstruction mechanism to enable our framework to encode skeleton dynamics and high-level semantics from unlabeled skeleton graphs, which encourages learning a discriminative skeleton representation for person Re-ID. Extensive experiments show that SM-SGE outperforms most state-of-the-art skeleton-based methods. We further demonstrate its effectiveness on 3D skeleton data estimated from large-scale RGB videos. Our codes are open at https://github.com/Kali-Hac/SM-SGE.