A weakly supervised adaptive triplet loss for deep metric learning
  視覚的類似性検索における距離計量学習の問題に対処します。これは、意味的および視覚的に類似する画像がより近く、異なる画像が互いに離れているユークリッド空間に画像を投影する画像埋め込みモデルの学習として定義されます。クロスドメインデータで一般化する学習画像埋め込みモデルを促進する、きめの細かいセマンティック類似性をキャプチャできる、弱く監督された適応トリプレットロス(ATL)を提示します。この方法では、弱くラベル付けされた製品説明データを使用して、詳細なセマンティッククラスを暗黙的に決定し、大量のトレーニングデータに注釈を付ける必要を回避します。 Amazonファッション検索ベンチマークとDeepFashionインショップ検索データで評価します。この方法は、クロスドメインデータでトリプレット損失ベースラインのパフォーマンスを10.6%向上させ、すべての評価指標で最先端のモデルよりも優れています。
We address the problem of distance metric learning in visual similarity search, defined as learning an image embedding model which projects images into Euclidean space where semantically and visually similar images are closer and dissimilar images are further from one another. We present a weakly supervised adaptive triplet loss (ATL) capable of capturing fine-grained semantic similarity that encourages the learned image embedding models to generalize well on cross-domain data. The method uses weakly labeled product description data to implicitly determine fine grained semantic classes, avoiding the need to annotate large amounts of training data. We evaluate on the Amazon fashion retrieval benchmark and DeepFashion in-shop retrieval data. The method boosts the performance of triplet loss baseline by 10.6% on cross-domain data and out-performs the state-of-art model on all evaluation metrics.
updated: Fri Sep 27 2019 20:54:42 GMT+0000 (UTC)
published: Fri Sep 27 2019 20:54:42 GMT+0000 (UTC)
