arXiv reaDer
FastV2C-HandNet:3D畳み込みニューラルネットワークを使用した手の姿勢推定を調整する高速ボクセル
FastV2C-HandNet: Fast Voxel to Coordinate Hand Pose Estimation with 3D Convolutional Neural Networks
 単眼深度画像からの手のポーズ推定は、コンピュータビジョンコミュニティで重要かつ挑戦的な問題でした。この論文では、2D深度画像から3D手関節位置を推定するための新しいアプローチを提示します。これまでのほとんどの方法とは異なり、このモデルは深度画像から3D空間情報をキャプチャするため、入力をより深く理解できます。入力の深度マップをボクセル化して入力の3D特徴をキャプチャし、3Dデータの増強を実行して、ネットワークを実世界の画像に対して堅牢にします。当社のネットワークは、他の方法と比較して時間とスペースの複雑さを大幅に削減するエンドツーエンドの方法でトレーニングされます。広範な実験を通じて、3D手関節の位置のトレーニングと予測に要する時間に関して、モデルが最先端の方法よりも優れていることを示します。これにより、この方法は、実際の手のポーズの推定シナリオにより適したものになります。
Hand pose estimation from monocular depth images has been an important and challenging problem in the Computer Vision community. In this paper, we present a novel approach to estimate 3D hand joint locations from 2D depth images. Unlike most of the previous methods, our model captures the 3D spatial information from a depth image thereby giving it a greater understanding of the input. We voxelize the input depth map to capture the 3D features of the input and perform 3D data augmentations to make our network robust to real-world images. Our network is trained in an end-to-end manner which reduces time and space complexity significantly when compared to other methods. Through extensive experiments, we show that our model outperforms state-of-the-art methods with respect to the time it takes to train and predict 3D hand joint locations. This makes our method more suitable for real-world hand pose estimation scenarios.
updated: Thu Feb 20 2020 14:31:45 GMT+0000 (UTC)
published: Mon Jul 15 2019 04:04:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト