arXiv reaDer
階段ネットワークによるシンプルで正確な人間の姿勢推定に向けて
Towards Simple and Accurate Human Pose Estimation with Stair Network
このホワイトペーパーでは、正確なキーポイント座標回帰タスクに取り組むことに焦点を当てています。ほとんどの既存のアプローチは、多数のパラメーターを持つ複雑なネットワークを採用しているため、実際には費用対効果の低い重いモデルになります。この制限を克服するために、STair Networkと呼ばれる小さいながらも識別力のあるモデルを開発します。これは、正確な多段階ポーズ推定システムに向けて簡単に積み重ねることができます。具体的には、計算コストを削減するために、STair Networkは、特徴の多様性を促進し、より少ないパラメーターで豊富なローカル表現を取得することに焦点を当てた新しい基本的な特徴抽出ブロックで構成され、効率とパフォーマンスの十分なバランスを可能にします。パフォーマンスをさらに向上させるために、機能の融合と補充に焦点を当てた、計算コストを無視できる2つのメカニズムを導入します。 2つの標準データセットでのSTairNetworkの有効性を示します。たとえば、1ステージSTair Networkは、パラメーターが80%少なく、GFLOPが68%少ないCOCOテストデータセットでHRNetよりも5.5%高い精度を達成します。
In this paper, we focus on tackling the precise keypoint coordinates regression task. Most existing approaches adopt complicated networks with a large number of parameters, leading to a heavy model with poor cost-effectiveness in practice. To overcome this limitation, we develop a small yet discrimicative model called STair Network, which can be simply stacked towards an accurate multi-stage pose estimation system. Specifically, to reduce computational cost, STair Network is composed of novel basic feature extraction blocks which focus on promoting feature diversity and obtaining rich local representations with fewer parameters, enabling a satisfactory balance on efficiency and performance. To further improve the performance, we introduce two mechanisms with negligible computational cost, focusing on feature fusion and replenish. We demonstrate the effectiveness of the STair Network on two standard datasets, e.g., 1-stage STair Network achieves a higher accuracy than HRNet by 5.5% on COCO test dataset with 80% fewer parameters and 68% fewer GFLOPs.
updated: Tue Nov 22 2022 02:43:47 GMT+0000 (UTC)
published: Fri Feb 18 2022 10:37:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト