arXiv reaDer
FreiHAND:単一のRGB画像から手のポーズと形状をマーカーレスでキャプチャするためのデータセット
FreiHAND: A Dataset for Markerless Capture of Hand Pose and Shape from Single RGB Images
  単一のRGB画像から3Dの手のポーズを推定することは、公平なトレーニングデータセットに依存する非常に曖昧な問題です。このホワイトペーパーでは、既存のデータセットをトレーニングする際に、データセット間の一般化を分析します。トレーニングを受けたデータセットでアプローチがうまく機能することがわかりましたが、他のデータセットやインザワイルドシナリオに一般化されていません。その結果、3Dの手のポーズと形状の注釈の両方を伴う最初の大規模なマルチビュー手のデータセットを導入します。この実世界のデータセットに注釈を付けるために、各サンプルの3Dポーズと形状の両方を推測するためのハンドフィッティング最適化を含む、反復的な半自動化された「ヒューマンインザループ」アプローチを提案します。データセットでトレーニングされたメソッドが、他のデータセットでテストされた場合、一貫してうまく機能することを示します。さらに、このデータセットを使用すると、単一のRGB画像から完全な手の形を予測するネットワークをトレーニングできます。評価セットは、明確な手の形状推定のベンチマークとして機能します。
Estimating 3D hand pose from single RGB images is a highly ambiguous problem that relies on an unbiased training dataset. In this paper, we analyze cross-dataset generalization when training on existing datasets. We find that approaches perform well on the datasets they are trained on, but do not generalize to other datasets or in-the-wild scenarios. As a consequence, we introduce the first large-scale, multi-view hand dataset that is accompanied by both 3D hand pose and shape annotations. For annotating this real-world dataset, we propose an iterative, semi-automated `human-in-the-loop' approach, which includes hand fitting optimization to infer both the 3D pose and shape for each sample. We show that methods trained on our dataset consistently perform well when tested on other datasets. Moreover, the dataset allows us to train a network that predicts the full articulated hand shape from a single RGB image. The evaluation set can serve as a benchmark for articulated hand shape estimation.
updated: Fri Sep 13 2019 09:04:40 GMT+0000 (UTC)
published: Tue Sep 10 2019 08:29:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト