arXiv reaDer
イントロスペクティブディープメトリックラーニング
Introspective Deep Metric Learning
この論文は、画像の不確実性を意識した比較のための内省的ディープメトリック学習(IDML)フレームワークを提案します。従来のディープメトリック学習方法は、不確実性レベルに関係なく、画像間に自信のある意味距離を生成します。ただし、優れた類似性モデルでは、より堅牢なトレーニングのためにあいまいな画像をより適切に処理するために、意味の不一致を慎重に検討する必要があると主張します。これを実現するために、セマンティック埋め込みだけでなく、画像のセマンティック特性とあいまいさをそれぞれ表す不確実性埋め込みを使用して画像を表現することを提案します。さらに、画像間の意味の違いとあいまいさの両方を考慮して画像間の類似性判断を行うための内省的類似性メトリックを提案します。私たちのフレームワークは、画像検索に広く使用されているCUB-200-2011、Cars196、およびStanfordOnlineProductsデータセットで最先端のパフォーマンスを実現します。さらに、ImageNet-1K、CIFAR-10、およびCIFAR-100データセットでの画像分類のフレームワークを評価します。これは、既存のデータ混合方法に提案された内省的メトリックを装備すると、一貫してより良い結果が得られることを示しています(たとえば、ImageNetのCutMixでは+0.44)。 -1K)。コードはhttps://github.com/wangck20/IDMLで入手できます。
This paper proposes an introspective deep metric learning (IDML) framework for uncertainty-aware comparisons of images. Conventional deep metric learning methods produce confident semantic distances between images regardless of the uncertainty level. However, we argue that a good similarity model should consider the semantic discrepancies with caution to better deal with ambiguous images for more robust training. To achieve this, we propose to represent an image using not only a semantic embedding but also an accompanying uncertainty embedding, which describes the semantic characteristics and ambiguity of an image, respectively. We further propose an introspective similarity metric to make similarity judgments between images considering both their semantic differences and ambiguities. Our framework attains state-of-the-art performance on the widely used CUB-200-2011, Cars196, and Stanford Online Products datasets for image retrieval. We further evaluate our framework for image classification on the ImageNet-1K, CIFAR-10, and CIFAR-100 datasets, which shows that equipping existing data mixing methods with the proposed introspective metric consistently achieves better results (e.g., +0.44 for CutMix on ImageNet-1K). Code is available at: https://github.com/wangck20/IDML.
updated: Mon May 09 2022 17:51:44 GMT+0000 (UTC)
published: Mon May 09 2022 17:51:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト