弱く教師あり学習は、ローカル機能メソッドが、対応が密にラベル付けされた大規模なデータセットを取得する際の障害を克服するのに役立ちます。ただし、弱い教師ありは検出と記述のステップによって引き起こされる損失を区別できないため、共同の記述後検出パイプライン内で弱教師あり学習を直接実行すると、パフォーマンスが制限されます。この論文では、弱教師あり局所特徴学習用に調整された、分離された記述後検出パイプラインを提案します。パイプライン内では、検出ステップは記述ステップから切り離され、識別可能で堅牢な記述子が学習されるまで延期されます。さらに、記述子の学習を向上させるために、カメラのポーズ情報を明示的に使用するための行からウィンドウへの検索戦略を導入します。広範な実験により、私たちの方法、つまりPoSFeat(Camera Pose Supervised Feature)は、以前の完全および弱く監視された方法よりも優れており、幅広いダウンストリームタスクで最先端のパフォーマンスを実現していることが示されています。
Weakly supervised learning can help local feature methods to overcome the obstacle of acquiring a large-scale dataset with densely labeled correspondences. However, since weak supervision cannot distinguish the losses caused by the detection and description steps, directly conducting weakly supervised learning within a joint describe-then-detect pipeline suffers limited performance. In this paper, we propose a decoupled describe-then-detect pipeline tailored for weakly supervised local feature learning. Within our pipeline, the detection step is decoupled from the description step and postponed until discriminative and robust descriptors are learned. In addition, we introduce a line-to-window search strategy to explicitly use the camera pose information for better descriptor learning. Extensive experiments show that our method, namely PoSFeat (Camera Pose Supervised Feature), outperforms previous fully and weakly supervised methods and achieves state-of-the-art performance on a wide range of downstream tasks.