arXiv reaDer
残差対数尤度推定による人間のポーズ回帰
Human Pose Regression with Residual Log-likelihood Estimation
ヒートマップベースの方法は、尤度ヒートマップを介して出力分布をモデル化することにより、人間の姿勢推定の分野で支配的です。対照的に、回帰ベースの方法はより効率的ですが、パフォーマンスが低下します。この作業では、効率的で効果的な回帰ベースの方法を開発するために最尤推定(MLE)を調査します。 MLEの観点からは、さまざまな回帰損失を採用することで、出力密度関数についてさまざまな仮定を立てることになります。真の分布に近い密度関数は、より良い回帰パフォーマンスにつながります。これに照らして、基礎となる出力分布をキャプチャするために、残差対数尤度推定(RLE)を使用した新しい回帰パラダイムを提案します。具体的には、RLEは、トレーニングプロセスを容易にするために、参照されていない基になる分布ではなく、分布の変更を学習します。提案された再パラメータ化設計により、私たちの方法は既製のフローモデルと互換性があります。提案された方法は、効果的、効率的かつ柔軟です。包括的な実験により、さまざまな人間の姿勢推定タスクにおけるその可能性を示します。従来の回帰パラダイムと比較して、RLEを使用した回帰は、テスト時間のオーバーヘッドなしでMSCOCOに12.4mAPの改善をもたらします。さらに、初めて、特に複数人のポーズ推定において、私たちの回帰法はヒートマップベースの方法よりも優れています。私たちのコードはhttps://github.com/Jeff-sjtu/res-loglikelihood-regressionで入手できます。
Heatmap-based methods dominate in the field of human pose estimation by modelling the output distribution through likelihood heatmaps. In contrast, regression-based methods are more efficient but suffer from inferior performance. In this work, we explore maximum likelihood estimation (MLE) to develop an efficient and effective regression-based methods. From the perspective of MLE, adopting different regression losses is making different assumptions about the output density function. A density function closer to the true distribution leads to a better regression performance. In light of this, we propose a novel regression paradigm with Residual Log-likelihood Estimation (RLE) to capture the underlying output distribution. Concretely, RLE learns the change of the distribution instead of the unreferenced underlying distribution to facilitate the training process. With the proposed reparameterization design, our method is compatible with off-the-shelf flow models. The proposed method is effective, efficient and flexible. We show its potential in various human pose estimation tasks with comprehensive experiments. Compared to the conventional regression paradigm, regression with RLE bring 12.4 mAP improvement on MSCOCO without any test-time overhead. Moreover, for the first time, especially on multi-person pose estimation, our regression method is superior to the heatmap-based methods. Our code is available at https://github.com/Jeff-sjtu/res-loglikelihood-regression
updated: Mon Jul 26 2021 03:10:48 GMT+0000 (UTC)
published: Fri Jul 23 2021 15:06:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト