ディープラーニング手法は、ポーズ推定で優れたパフォーマンスを実現しましたが、堅牢性が欠如しているため、類似した画像間でキーポイントが大幅に変化します。この問題を考慮して、小さな摂動に対するネットワークの脆弱性を軽減するために、安定したヒートマップ回帰法が提案されています。ヒートマップ内の異なる行と列の間の相関関係を利用してマルチピークの問題を軽減し、高度に差別化されたヒートマップ回帰を設計して、キーポイントを周囲のポイントと区別できるようにします。最大安定性トレーニング損失は、2つの類似した画像の予測ギャップを最小化する際の最適化の難しさを単純化するために使用されます。提案された方法は、2つのベンチマークデータセットで最先端のアプローチよりも堅牢性を大幅に向上させ、高いパフォーマンスを維持します。
Deep learning methods have achieved excellent performance in pose estimation, but the lack of robustness causes the keypoints to change drastically between similar images. In view of this problem, a stable heatmap regression method is proposed to alleviate network vulnerability to small perturbations. We utilize the correlation between different rows and columns in a heatmap to alleviate the multi-peaks problem, and design a highly differentiated heatmap regression to make a keypoint discriminative from surrounding points. A maximum stability training loss is used to simplify the optimization difficulty when minimizing the prediction gap of two similar images. The proposed method achieves a significant advance in robustness over state-of-the-art approaches on two benchmark datasets and maintains high performance.