arXiv reaDer
FourierHandFlow: フーリエ クエリ フローを使用したニューラル 4D 手の表現
FourierHandFlow: Neural 4D Hand Representation Using Fourier Query Flow
最近の 4D 形状表現は、(1) 形状とアーティキュレーション事前分布を利用せずにクエリ フローを学習する、または (2) 時間値ごとに形状占有を個別にデコードすることによって、暗黙的な形状の連続的な時間的進化をモデル化します。したがって、これらは、多関節形状間の暗黙の対応関係を効果的に捕捉したり、不安定な時間的変形を規則化したりすることはありません。この研究では、3D 占有フィールドとフーリエ級数として表現される関節認識クエリ フローを組み合わせた人間の手の時空間連続表現である FourierHandFlow を紹介します。入力 RGB シーケンスが与えられると、クエリ フローごとに固定数のフーリエ係数を学習して、滑らかで連続的な時間形状ダイナミクスを保証することを目指します。関節のある手の時空間変形を効果的にモデル化するために、2 種類のフーリエ クエリ フローに基づいて 4D 表現を構成します。(1) 暗黙的な線形ブレンド スキニングによる手の関節の変化によって影響を受けるクエリ ダイナミクスをモデル化するポーズ フローと、(2) 形状フローこれはクエリごとの変位フローをモデル化します。実験では、私たちの方法は、既存の 3D/4D 暗黙的形状表現よりも計算効率が高く、ビデオベースの 4D 再構成で最先端の結果を達成しました。さらに、暗黙的な形状の学習された対応関係を使用した、モーションの内挿および外挿、およびテクスチャ転送に関する結果を示します。私たちの知る限り、FourierHandFlow は、RGB ビデオから学習された最初のニューラル 4D 連続手の表現です。コードは一般に公開されます。
Recent 4D shape representations model continuous temporal evolution of implicit shapes by (1) learning query flows without leveraging shape and articulation priors or (2) decoding shape occupancies separately for each time value. Thus, they do not effectively capture implicit correspondences between articulated shapes or regularize jittery temporal deformations. In this work, we present FourierHandFlow, which is a spatio-temporally continuous representation for human hands that combines a 3D occupancy field with articulation-aware query flows represented as Fourier series. Given an input RGB sequence, we aim to learn a fixed number of Fourier coefficients for each query flow to guarantee smooth and continuous temporal shape dynamics. To effectively model spatio-temporal deformations of articulated hands, we compose our 4D representation based on two types of Fourier query flow: (1) pose flow that models query dynamics influenced by hand articulation changes via implicit linear blend skinning and (2) shape flow that models query-wise displacement flow. In the experiments, our method achieves state-of-the-art results on video-based 4D reconstruction while being computationally more efficient than the existing 3D/4D implicit shape representations. We additionally show our results on motion inter- and extrapolation and texture transfer using the learned correspondences of implicit shapes. To the best of our knowledge, FourierHandFlow is the first neural 4D continuous hand representation learned from RGB videos. The code will be publicly accessible.
updated: Sun Jul 16 2023 16:58:37 GMT+0000 (UTC)
published: Sun Jul 16 2023 16:58:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト