3D Human Motion Indexing and Retrievalは、データ駆動型アニメーション、スポーツバイオメカニクスの分析、人間の監視など、3D人間の骨格データの分析および/または再利用を目的としたいくつかのデータ駆動型アプリケーションの台頭により、興味深い問題です等。人間の時空間的明瞭度、ノイズ/欠落データ、同じ動きの異なる速度などにより困難になり、既存の最先端の方法のいくつかは、最適化ベースまたはヒストグラムベースの比較とともに手作業の特徴を使用します検索を実行します。さらに、彼らは非常に小さなデータセットと少数のクラスに対してのみそれを実証します。運動を認識し、差別的なランキングを実施する必要がある学習済み表現を使用するケースを作成します。そのために、ディープネットワークを使用して学習した3D人間モーション記述子を提案します。学習した埋め込みは一般化可能で、実世界のデータに適用できます-前述の課題に対処し、さらに別のネットワークを使用して埋め込みスペースでサブモーション検索を可能にします。このモデルは、軌道キューを使用してクラス間の類似性を活用し、自己監視設定ではるかに優れたパフォーマンスを発揮します。これらすべての面での最新の結果は、2つの大規模な3D人間モーションデータセット(NTU RGB + DおよびHDM05)で示されています。
3D Human Motion Indexing and Retrieval is an interesting problem due to the rise of several data-driven applications aimed at analyzing and/or re-utilizing 3D human skeletal data, such as data-driven animation, analysis of sports bio-mechanics, human surveillance etc. Spatio-temporal articulations of humans, noisy/missing data, different speeds of the same motion etc. make it challenging and several of the existing state of the art methods use hand-craft features along with optimization based or histogram based comparison in order to perform retrieval. Further, they demonstrate it only for very small datasets and few classes. We make a case for using a learned representation that should recognize the motion as well as enforce a discriminative ranking. To that end, we propose, a 3D human motion descriptor learned using a deep network. Our learned embedding is generalizable and applicable to real-world data - addressing the aforementioned challenges and further enables sub-motion searching in its embedding space using another network. Our model exploits the inter-class similarity using trajectory cues, and performs far superior in a self-supervised setting. State of the art results on all these fronts is shown on two large scale 3D human motion datasets - NTU RGB+D and HDM05.