arXiv reaDer
手形状推定のための対照表現学習
Contrastive Representation Learning for Hand Shape Estimation
この作業は、教師なし学習の最近の進歩に基づいて、単眼の手形状推定の改善を示しています。私たちはモメンタム対照学習を拡張し、HanCo と呼ばれる視覚的表現学習に適した構造化された手の画像コレクションを提供します。確立された対照的な学習方法によって学習された表現は、高度な背景除去技術とマルチビュー情報を活用することで大幅に改善できることがわかりました。これらにより、見本ベースのアプローチで一般的に使用される拡張によって取得されるものよりも多様なインスタンスのペアを生成できます。私たちの方法は、手の形状推定タスクのより適切な表現につながり、ImageNet の事前トレーニング済みベースラインと比較して、メッシュ エラーが 4.7% 減少し、F スコアが 3.6% 向上することを示しています。この方向へのさらなる研究を促進するために、私たちはベンチマーク データセットを公開しています。
This work presents improvements in monocular hand shape estimation by building on top of recent advances in unsupervised learning. We extend momentum contrastive learning and contribute a structured collection of hand images, well suited for visual representation learning, which we call HanCo. We find that the representation learned by established contrastive learning methods can be improved significantly by exploiting advanced background removal techniques and multi-view information. These allow us to generate more diverse instance pairs than those obtained by augmentations commonly used in exemplar based approaches. Our method leads to a more suitable representation for the hand shape estimation task and shows a 4.7% reduction in mesh error and a 3.6% improvement in F-score compared to an ImageNet pretrained baseline. We make our benchmark dataset publicly available, to encourage further research into this direction.
updated: Tue Jun 08 2021 13:31:58 GMT+0000 (UTC)
published: Tue Jun 08 2021 13:31:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト