arXiv reaDer
TriHorn-Net:正確な深度ベースの3D手のポーズ推定のモデル
TriHorn-Net: A Model for Accurate Depth-Based 3D Hand Pose Estimation
最近、3D手のポーズ推定法が大きく進歩しました。ただし、推定精度は、特定の実際のアプリケーションには十分とは言えないことが多いため、大幅な改善の余地があります。この論文は、深さ画像の手のポーズ推定精度を改善するために特定の革新を使用する新しいモデルであるTriHorn-Netを提案します。最初の革新は、3D手のポーズ推定を、深度画像空間(UV)内の2D関節位置の推定に分解し、2つの補完的な注意マップを使用して対応する深度を推定することです。この分解により、より困難なタスクである深度推定が、予測レベルと特徴レベルの両方でUV推定に干渉するのを防ぎます。 2番目の革新はPixDropoutです。これは、私たちの知る限りでは、手の奥行き画像のための最初の外観ベースのデータ拡張方法です。実験結果は、提案されたモデルが3つの公開ベンチマークデータセットで最先端の方法よりも優れていることを示しています。私たちの実装はhttps://github.com/mrezaei92/TriHorn-Netで入手できます。
3D hand pose estimation methods have made significant progress recently. However, the estimation accuracy is often far from sufficient for specific real-world applications, and thus there is significant room for improvement. This paper proposes TriHorn-Net, a novel model that uses specific innovations to improve hand pose estimation accuracy on depth images. The first innovation is the decomposition of the 3D hand pose estimation into the estimation of 2D joint locations in the depth image space (UV), and the estimation of their corresponding depths aided by two complementary attention maps. This decomposition prevents depth estimation, which is a more difficult task, from interfering with the UV estimations at both the prediction and feature levels. The second innovation is PixDropout, which is, to the best of our knowledge, the first appearance-based data augmentation method for hand depth images. Experimental results demonstrate that the proposed model outperforms the state-of-the-art methods on three public benchmark datasets. Our implementation is available at https://github.com/mrezaei92/TriHorn-Net.
updated: Sun Jun 26 2022 12:18:20 GMT+0000 (UTC)
published: Tue Jun 14 2022 19:08:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト