arXiv reaDer
EvHandPose: スパース スーパービジョンによるイベントベースの 3D ハンド ポーズ推定
EvHandPose: Event-based 3D Hand Pose Estimation with Sparse Supervision
イベント カメラは、3D の手の姿勢の推定に大きな可能性を示しています。特に、高速な動きと高ダイナミック レンジの課題に低電力で対処しています。ただし、非同期差分イメージング メカニズムが原因で、特に手が動いていない場合 (モーションのあいまいさの原因)、イベント表現を設計して手の動き情報をエンコードすることは困難であり、時間的に密なイベント ストリームに完全に注釈を付けることは実行不可能です。この論文では、正確な手のポーズ推定と動きのあいまいさの問題を軽減するために、Event-to-Pose モジュールで新しいハンド フロー表現を使用した EvHandPose を提案します。スパース アノテーションの問題を解決するために、Pose-to-IWE (Image with Warped Events) モジュールでコントラストの最大化とエッジの制約を設計し、自己監視フレームワークで EvHandPose を定式化します。さらに、合成データに依存することによるドメインギャップを埋め、将来の研究を促進するために、いくつかの困難なシーンで最初の大規模な現実世界のイベントベースの手ポーズデータセットである EvRealHands を構築します。 EvRealHands での実験では、EvHandPose がすべての評価シーンで以前のイベントベースの方法よりも MPJPE が 15 ~ 20 mm 低く、RGB ベースの方法と比較して動きの速いシーンや強い光のシーンで正確かつ安定した手の姿勢推定を実現することが実証されています。さらに、EvHandPose は 120 fps 以上での 3D ハンド ポーズ推定を示します。
Event camera shows great potential in 3D hand pose estimation, especially addressing the challenges of fast motion and high dynamic range in a low-power way. However, due to the asynchronous differential imaging mechanism, it is challenging to design event representation to encode hand motion information especially when the hands are not moving (causing motion ambiguity), and it is infeasible to fully annotate the temporally dense event stream. In this paper, we propose EvHandPose with novel hand flow representations in Event-to-Pose module for accurate hand pose estimation and alleviating the motion ambiguity issue. To solve the problem under sparse annotation, we design contrast maximization and edge constraints in Pose-to-IWE (Image with Warped Events) module and formulate EvHandPose in a self-supervision framework. We further build EvRealHands, the first large-scale real-world event-based hand pose dataset on several challenging scenes to bridge the domain gap due to relying on synthetic data and facilitate future research. Experiments on EvRealHands demonstrate that EvHandPose outperforms previous event-based method under all evaluation scenes with 15 ∼ 20 mm lower MPJPE and achieves accurate and stable hand pose estimation in fast motion and strong light scenes compared with RGB-based methods. Furthermore, EvHandPose demonstrates 3D hand pose estimation at 120 fps or higher.
updated: Mon Mar 06 2023 03:27:17 GMT+0000 (UTC)
published: Mon Mar 06 2023 03:27:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト