The Devil is in the Details: Delving into Unbiased Data Processing for Human Pose Estimation
トレーニングと推論の基本的なコンポーネントであるため、データ処理は、人間の姿勢推定コミュニティでは、私たちの知る限り、体系的に考慮されていません。この論文では、この問題に焦点を当て、人間の姿勢推定の進化の悪魔が偏ったデータ処理にあることを発見しました。具体的には、主に座標系変換やキーポイント形式変換(エンコードとデコード)を含む最先端のアプローチで標準的なデータ処理を調査することにより、一般的なフリッピング戦略によって得られた結果が元の結果と一致していないことがわかります推論で。さらに、一部のキーポイント形式の変換方法には統計エラーがあります。 2つの問題が組み合わさって、ポーズ推定のパフォーマンスが大幅に低下し、研究コミュニティに罠が仕掛けられます。この罠は、常に報告されておらず、混乱を招きますが影響力のある多くの次善の救済策に骨を与えています。生殖の失敗と比較して不公平を引き起こすことによって、報告されていない救済策は技術開発を深刻に妨げます。ソースからのこのジレンマに取り組むために、バイアスのないデータ処理(UDP)は、前述の2つの問題の2つの手法の側面(つまり、バイアスのない座標系変換とバイアスのないキーポイント形式の変換)で構成されることを提案します。モデルにとらわれないアプローチと優れたソリューションとして、UDPは人間の姿勢推定のパフォーマンス境界を上手く押し上げ、研究コミュニティに、より高く、より信頼性の高いベースラインを提供します。コードはで公開されています
Being a fundamental component in training and inference, data processing has not been systematically considered in human pose estimation community, to the best of our knowledge. In this paper, we focus on this problem and find that the devil of human pose estimation evolution is in the biased data processing. Specifically, by investigating the standard data processing in state-of-the-art approaches mainly including coordinate system transformation and keypoint format transformation (i.e., encoding and decoding), we find that the results obtained by common flipping strategy are unaligned with the original ones in inference. Moreover, there is a statistical error in some keypoint format transformation methods. Two problems couple together, significantly degrade the pose estimation performance and thus lay a trap for the research community. This trap has given bone to many suboptimal remedies, which are always unreported, confusing but influential. By causing failure in reproduction and unfair in comparison, the unreported remedies seriously impedes the technological development. To tackle this dilemma from the source, we propose Unbiased Data Processing (UDP) consist of two technique aspect for the two aforementioned problems respectively (i.e., unbiased coordinate system transformation and unbiased keypoint format transformation). As a model-agnostic approach and a superior solution, UDP successfully pushes the performance boundary of human pose estimation and offers a higher and more reliable baseline for research community. Code is public available in
updated: Thu Dec 31 2020 04:39:42 GMT+0000 (UTC)
published: Mon Nov 18 2019 10:17:12 GMT+0000 (UTC)
