arXiv reaDer
プロキシベースのディープメトリック学習のための非等方性正則化
Non-isotropy Regularization for Proxy-based Deep Metric Learning
Deep Metric Learning(DML)は、事前定義された距離メトリックを介して意味関係を簡単に表現できる表現空間を学習することを目的としています。最高のパフォーマンスを発揮するアプローチは、通常、収束と一般化を改善するためのサンプルの代用としてクラスプロキシを活用します。ただし、これらのプロキシメソッドは、サンプルプロキシ距離を最適化するだけです。使用される距離関数の固有の非双対性を考えると、これは局所的に等方性のサンプル分布を誘発する可能性があり、局所構造とサンプル間のクラス内関係を解決するのが難しいため、重要なセマンティックコンテキストが失われることになります。この問題を軽減するために、プロキシベースのディープメトリック学習のための非等方性正則化(NIR)を提案します。正規化フローを活用することで、それぞれのクラスプロキシからのサンプルの独自の翻訳可能性を実現します。これにより、プロキシの周囲にサンプルの非等方性分布を明示的に誘導して、最適化することができます。そうすることで、ローカル構造をよりよく学習するためのプロキシベースの目標を装備します。広範な実験により、標準ベンチマークCUB200-2011、Cars196、およびStanford Online Productsで競争力のある最先端のパフォーマンスを達成しながら、NIRの一貫した一般化の利点が強調されています。さらに、プロキシベースの方法の優れた収束特性は依然として維持または改善されており、NIRは実際の使用に非常に魅力的です。コードはhttps://github.com/ExplainableML/NonIsotropicProxyDMLで入手できます。
Deep Metric Learning (DML) aims to learn representation spaces on which semantic relations can simply be expressed through predefined distance metrics. Best performing approaches commonly leverage class proxies as sample stand-ins for better convergence and generalization. However, these proxy-methods solely optimize for sample-proxy distances. Given the inherent non-bijectiveness of used distance functions, this can induce locally isotropic sample distributions, leading to crucial semantic context being missed due to difficulties resolving local structures and intraclass relations between samples. To alleviate this problem, we propose non-isotropy regularization (NIR) for proxy-based Deep Metric Learning. By leveraging Normalizing Flows, we enforce unique translatability of samples from their respective class proxies. This allows us to explicitly induce a non-isotropic distribution of samples around a proxy to optimize for. In doing so, we equip proxy-based objectives to better learn local structures. Extensive experiments highlight consistent generalization benefits of NIR while achieving competitive and state-of-the-art performance on the standard benchmarks CUB200-2011, Cars196 and Stanford Online Products. In addition, we find the superior convergence properties of proxy-based methods to still be retained or even improved, making NIR very attractive for practical usage. Code available at https://github.com/ExplainableML/NonIsotropicProxyDML.
updated: Wed Mar 16 2022 11:13:20 GMT+0000 (UTC)
published: Wed Mar 16 2022 11:13:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト