arXiv reaDer
AggPose:幼児のポーズ推定のためのディープアグリゲーションビジョントランスフォーマー
AggPose: Deep Aggregation Vision Transformer for Infant Pose Estimation
新生児の動きと姿勢の評価により、経験豊富な小児科医は神経発達障害を予測し、関連する疾患への早期介入を可能にします。ただし、人間のポーズ推定方法の最新のAIアプローチのほとんどは成人に焦点を当てており、乳児のポーズ推定のベンチマークは公開されていません。この論文では、幼児のポーズデータセットと人間のポーズ推定のためのディープアグリゲーションビジョントランスフォーマーを提案することでこのギャップを埋めます。 Transformer + MLPを機能マップ内の高解像度の深層集約に一般化するため、異なる視覚レベル間の情報融合が可能になります。 COCOポーズデータセットでAggPoseを事前トレーニングし、新しくリリースされた大規模な幼児ポーズ推定データセットに適用します。結果は、AggPoseがさまざまな解像度の間でマルチスケール機能を効果的に学習し、乳児のポーズ推定のパフォーマンスを大幅に向上させることができることを示しています。乳児のポーズ推定データセットでは、AggPoseがハイブリッドモデルHRFormerおよびTokenPoseよりも優れていることを示しています。さらに、私たちのAggPoseは、平均してCOCO値ポーズ推定でHRFormerを0.7%AP上回っています。私たちのコードはgithub.com/SZAR-LAB/AggPoseで入手できます。
Movement and pose assessment of newborns lets experienced pediatricians predict neurodevelopmental disorders, allowing early intervention for related diseases. However, most of the newest AI approaches for human pose estimation methods focus on adults, lacking publicly benchmark for infant pose estimation. In this paper, we fill this gap by proposing infant pose dataset and Deep Aggregation Vision Transformer for human pose estimation, which introduces a fast trained full transformer framework without using convolution operations to extract features in the early stages. It generalizes Transformer + MLP to high-resolution deep layer aggregation within feature maps, thus enabling information fusion between different vision levels. We pre-train AggPose on COCO pose dataset and apply it on our newly released large-scale infant pose estimation dataset. The results show that AggPose could effectively learn the multi-scale features among different resolutions and significantly improve the performance of infant pose estimation. We show that AggPose outperforms hybrid model HRFormer and TokenPose in the infant pose estimation dataset. Moreover, our AggPose outperforms HRFormer by 0.7% AP on COCO val pose estimation on average. Our code is available at github.com/SZAR-LAB/AggPose.
updated: Wed May 11 2022 05:34:14 GMT+0000 (UTC)
published: Wed May 11 2022 05:34:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト