arXiv reaDer
スニペット:ビデオスニペットでの同時マルチパーソン3Dポーズ推定追跡および予測のための時空間トランスフォーマー
Snipper: A Spatiotemporal Transformer for Simultaneous Multi-Person 3D Pose Estimation Tracking and Forecasting on a Video Snippet
RGBビデオからの複数人のポーズの理解には、ポーズの推定、追跡、モーション予測の3つの複雑なタスクが含まれます。これらの3つのタスクの中で、ポーズの推定と追跡は相関しており、追跡はモーション予測に不可欠です。ほとんどの既存の作業は、単一のタスクに焦点を当てるか、カスケードされた方法を使用して個々のタスクを個別に解決します。本論文では、単一の推論で複数人の3Dポーズ推定、追跡、およびモーション予測を同時に実行するフレームワークであるSnipperを提案します。具体的には、まず、ビデオスニペットから時空間情報を集約するための変形可能な注意メカニズムを提案します。この変形可能な注意に基づいて、視覚トランスフォーマーは、マルチフレーム画像から時空間特徴をエンコードし、有益なポーズ特徴をデコードして複数人のポーズクエリを更新することを学習します。最後に、これらのクエリは、1回のフォワードパスで複数人のポーズの軌跡と将来の動きを予測するために回帰されます。実験では、一般的なモデルがポーズの推定、追跡、および予測のための特殊な最先端のベースラインに匹敵する3つの挑戦的な公開データセットに対するSnipperの有効性を示します。コードはhttps://github.com/JimmyZou/Snipperhttps://github.com/JimmyZou/Snipperで入手できます。
Multi-person pose understanding from RGB videos includes three complex tasks: pose estimation, tracking and motion forecasting. Among these three tasks, pose estimation and tracking are correlated, and tracking is crucial to motion forecasting. Most existing works either focus on a single task or employ cascaded methods to solve each individual task separately. In this paper, we propose Snipper, a framework to perform multi-person 3D pose estimation, tracking and motion forecasting simultaneously in a single inference. Specifically, we first propose a deformable attention mechanism to aggregate spatiotemporal information from video snippets. Building upon this deformable attention, a visual transformer is learned to encode the spatiotemporal features from multi-frame images and to decode informative pose features to update multi-person pose queries. Last, these queries are regressed to predict multi-person pose trajectories and future motions in one forward pass. In the experiments, we show the effectiveness of Snipper on three challenging public datasets where a generic model rivals specialized state-of-art baselines for pose estimation, tracking, and forecasting. Code is available at https://github.com/JimmyZou/Snipperhttps://github.com/JimmyZou/Snipper.
updated: Sat Jul 09 2022 18:42:14 GMT+0000 (UTC)
published: Sat Jul 09 2022 18:42:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト