arXiv reaDer
確率論的なピクセルごとのパーツセグメンテーションを介して、強く相互作用する手を明確にすることを学ぶ
Learning to Disambiguate Strongly Interacting Hands via Probabilistic Per-pixel Part Segmentation
自然な会話や相互作用では、私たちの手はしばしば重なり合ったり、互いに接触したりします。手の外観が均一であるため、画像から相互作用する手の3Dポーズを推定することは困難です。この論文では、自己相似性、およびピクセル観測をそれぞれの手とその部分に割り当てる際に生じるあいまいさが、最終的な3Dポーズエラーの主な原因であることを示します。この洞察に動機付けられて、単一の単眼画像から2つの相互作用する手の3Dポーズを推定するための新しい方法であるDIGITを提案します。この方法は、入力画像をピクセルごとのセマンティックパーツセグメンテーションマスクと視覚的特徴ボリュームに処理する2つの織り交ぜられたブランチで構成されます。以前の作業とは対照的に、セグメンテーションをポーズ推定段階から切り離すのではなく、下流のポーズ推定タスクでピクセルごとの確率を直接活用します。そのために、パーツの確率が視覚的特徴とマージされ、完全畳み込み層を介して処理されます。提案されたアプローチがInterHand2.6Mデータセットで新しい最先端のパフォーマンスを達成することを実験的に示します。私たちの方法の有効性を実証し、ピクセル所有権のモデリングが3D手のポーズ推定にどのように影響するかについての洞察を提供するために、詳細なアブレーション研究を提供します。
In natural conversation and interaction, our hands often overlap or are in contact with each other. Due to the homogeneous appearance of hands, this makes estimating the 3D pose of interacting hands from images difficult. In this paper we demonstrate that self-similarity, and the resulting ambiguities in assigning pixel observations to the respective hands and their parts, is a major cause of the final 3D pose error. Motivated by this insight, we propose DIGIT, a novel method for estimating the 3D poses of two interacting hands from a single monocular image. The method consists of two interwoven branches that process the input imagery into a per-pixel semantic part segmentation mask and a visual feature volume. In contrast to prior work, we do not decouple the segmentation from the pose estimation stage, but rather leverage the per-pixel probabilities directly in the downstream pose estimation task. To do so, the part probabilities are merged with the visual features and processed via fully-convolutional layers. We experimentally show that the proposed approach achieves new state-of-the-art performance on the InterHand2.6M dataset. We provide detailed ablation studies to demonstrate the efficacy of our method and to provide insights into how the modelling of pixel ownership affects 3D hand pose estimation.
updated: Sun Nov 28 2021 11:13:05 GMT+0000 (UTC)
published: Thu Jul 01 2021 13:28:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト