arXiv reaDer
キーポイント推定タスクの座標デコードについて
On Coordinate Decoding for Keypoint Estimation Tasks
一連の2D(および3D)キーポイント推定タスクは、ヒートマップ座標表現、つまり、グリッド上のキーポイント座標の学習可能で空間認識可能なエンコードとデコードを可能にし、サブピクセル座標の精度を可能にする確率マップに基づいて構築されます。このレポートでは、グラウンドトゥルースヒートマップのエンコードと予測ヒートマップのキーポイント座標へのデコードの重要性を強調することにより、2Dヒートマップ表現を調査したDARKの調査結果を再現することを目的としています。著者は、a)より原理的な分布認識座標復号法が、文献で広く使用されている標準的な手法の制限を克服し、b)正確で連続的なヒートマップ分布を生成することにより、グラウンドトゥルース座標からヒートマップを再構築すると、入力画像グリッドの解像度でキーポイント座標を量子化する標準の座標エンコードプロセスとは対照的に、バイアスのないモデルトレーニングに。
A series of 2D (and 3D) keypoint estimation tasks are built upon heatmap coordinate representation, i.e. a probability map that allows for learnable and spatially aware encoding and decoding of keypoint coordinates on grids, even allowing for sub-pixel coordinate accuracy. In this report, we aim to reproduce the findings of DARK that investigated the 2D heatmap representation by highlighting the importance of the encoding of the ground truth heatmap and the decoding of the predicted heatmap to keypoint coordinates. The authors claim that a) a more principled distribution-aware coordinate decoding method overcomes the limitations of the standard techniques widely used in the literature, and b), that the reconstruction of heatmaps from ground-truth coordinates by generating accurate and continuous heatmap distributions lead to unbiased model training, contrary to the standard coordinate encoding process that quantizes the keypoint coordinates on the resolution of the input image grid.
updated: Tue Oct 19 2021 22:14:48 GMT+0000 (UTC)
published: Tue Oct 19 2021 22:14:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト