arXiv reaDer
人間の反応を生成するための相互作用トランス
Interaction Transformer for Human Reaction Generation
入力アクションに基づいて対応する反応を生成することを目的とした、人間の反応生成の困難なタスクに対処します。既存の作品のほとんどは、反応の生成と予測に焦点を当てておらず、アクションのみが入力として与えられた場合、モーションを生成することはできません。この制限に対処するために、時間的および空間的注意の両方を備えたTransformerネットワークで構成される新しい相互作用Transformer(InterFormer)を提案します。具体的には、時間的注意は、両方のキャラクターの動きとそれらの相互作用の時間的依存関係をキャプチャし、空間的注意は、各キャラクターの異なる身体部分と相互作用の一部であるものとの間の依存関係を学習します。さらに、グラフを使用して、両方のキャラクターの近くの関節に焦点を合わせるのに役立つ相互作用距離モジュールを介して、空間的注意のパフォーマンスを向上させることを提案します。 SBUの相互作用、K3HI、およびDuetDanceデータセットに関する広範な実験により、InterFormerの有効性が実証されています。私たちの方法は一般的であり、より複雑で長期的な相互作用を生成するために使用できます。
We address the challenging task of human reaction generation which aims to generate a corresponding reaction based on an input action. Most of the existing works do not focus on generating and predicting the reaction and cannot generate the motion when only the action is given as input. To address this limitation, we propose a novel interaction Transformer (InterFormer) consisting of a Transformer network with both temporal and spatial attentions. Specifically, the temporal attention captures the temporal dependencies of the motion of both characters and of their interaction, while the spatial attention learns the dependencies between the different body parts of each character and those which are part of the interaction. Moreover, we propose using graphs to increase the performance of the spatial attention via an interaction distance module that helps focus on nearby joints from both characters. Extensive experiments on the SBU interaction, K3HI, and DuetDance datasets demonstrate the effectiveness of InterFormer. Our method is general and can be used to generate more complex and long-term interactions.
updated: Mon Jul 04 2022 19:30:41 GMT+0000 (UTC)
published: Mon Jul 04 2022 19:30:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト