Improved Embeddings with Easy Positive Triplet Mining
 ディープメトリックラーニングは、意味的に類似した画像が近くの場所に埋め込まれ、意味的に似ていない画像が遠くの場所に埋め込まれる埋め込みを定義しようとします。実質的な研究では、損失関数と、同じクラスの画像を埋め込みスペースにできるだけ近づけてプッシュすることにより、これらの埋め込みを学習する戦略に焦点を当ててきました。この論文では、各トレーニング画像を同じクラスの最も類似した例にマッピングするだけの埋め込み関数を必要とする、代替の緩やかな埋め込み戦略を提案します。これは「イージーポジティブ」マイニングと呼ばれます。この簡単なポジティブマイニングは、より柔軟で、新しい不可視データに対してより一般化された埋め込みにつながることを強調する実験と視覚化のコレクションを提供します。このシンプルなマイニング戦略により、CUB、Stanford Online Products、In-Shop Clothes、Hotels-50Kなどの画像検索データセットで、最先端のアプローチ(複雑な損失関数とアンサンブルメソッドを含む)を超えるリコールパフォーマンスが得られます。
Deep metric learning seeks to define an embedding where semantically similar images are embedded to nearby locations, and semantically dissimilar images are embedded to distant locations. Substantial work has focused on loss functions and strategies to learn these embeddings by pushing images from the same class as close together in the embedding space as possible. In this paper, we propose an alternative, loosened embedding strategy that requires the embedding function only map each training image to the most similar examples from the same class, an approach we call "Easy Positive" mining. We provide a collection of experiments and visualizations that highlight that this Easy Positive mining leads to embeddings that are more flexible and generalize better to new unseen data. This simple mining strategy yields recall performance that exceeds state of the art approaches (including those with complicated loss functions and ensemble methods) on image retrieval datasets including CUB, Stanford Online Products, In-Shop Clothes and Hotels-50K.
updated: Wed Mar 18 2020 18:58:28 GMT+0000 (UTC)
published: Mon Apr 08 2019 21:41:28 GMT+0000 (UTC)
