この論文は、オブジェクトランドマーク検出器の教師なし学習のための新しいパラダイムを提案します。画像生成や等分散などの補助タスクに基づく既存の方法とは異なり、一般的なキーポイントから離れて、ランドマーク検出器と記述子がそれ自体を改善するようにトレーニングされ、キーポイントを特徴的なランドマークに調整するセルフトレーニングアプローチを提案します。この目的のために、特徴クラスタリングによる新しい疑似ラベルの生成と、対照学習による各疑似クラスの特徴的な特徴の学習を交互に行う反復アルゴリズムを提案します。ランドマーク検出器と記述子の共有バックボーンにより、キーポイントの場所は安定したランドマークに徐々に収束し、安定性の低いランドマークをフィルタリングします。以前の作品と比較して、私たちのアプローチは、大きな視点の変化を捉えるという点でより柔軟なポイントを学ぶことができます。 LS3D、BBCPose、Human3.6M、PennActionなど、さまざまな難しいデータセットでメソッドを検証し、最新の結果を実現します。
This paper proposes a novel paradigm for the unsupervised learning of object landmark detectors. Contrary to existing methods that build on auxiliary tasks such as image generation or equivariance, we propose a self-training approach where, departing from generic keypoints, a landmark detector and descriptor is trained to improve itself, tuning the keypoints into distinctive landmarks. To this end, we propose an iterative algorithm that alternates between producing new pseudo-labels through feature clustering and learning distinctive features for each pseudo-class through contrastive learning. With a shared backbone for the landmark detector and descriptor, the keypoint locations progressively converge to stable landmarks, filtering those less stable. Compared to previous works, our approach can learn points that are more flexible in terms of capturing large viewpoint changes. We validate our method on a variety of difficult datasets, including LS3D, BBCPose, Human3.6M and PennAction, achieving new state of the art results.