arXiv reaDer
MIC: Mining Interclass Characteristics for Improved Metric Learning
  メトリック学習は、クラス定義の関係が埋め込みスペースによってキャプチャされるように、オブジェクトの画像を埋め込みます。ただし、画像の変動は、描かれたオブジェクトクラスの違いだけでなく、視点や照明などの他の潜在的な特性にも依存します。これらの構造化されたプロパティに加えて、ランダムノイズは関心のある視覚的関係をさらに妨害します。メトリック学習の一般的なアプローチは、対象となる要因を除くすべての要因の下で不変の表現を強制することです。対照的に、オブジェクトクラスによって共有され、オブジェクトクラスを横断する潜在的な特性を明示的に学習することを提案します。次に、未知のランダムノイズであると仮定するのではなく、構造化された視覚的変動性を直接説明します。クラス全体で共有される視覚的特性を別のエンコーダーで学習するための新しい代理タスクを提案します。このエンコーダは、相互情報を削減することにより、クラス情報のエンコーダと共同でトレーニングされます。 5つの標準的な画像検索ベンチマークでは、このアプローチは最新技術を大幅に改善しています。
Metric learning seeks to embed images of objects suchthat class-defined relations are captured by the embeddingspace. However, variability in images is not just due to different depicted object classes, but also depends on other latent characteristics such as viewpoint or illumination. In addition to these structured properties, random noise further obstructs the visual relations of interest. The common approach to metric learning is to enforce a representation that is invariant under all factors but the ones of interest. In contrast, we propose to explicitly learn the latent characteristics that are shared by and go across object classes. We can then directly explain away structured visual variability, rather than assuming it to be unknown random noise. We propose a novel surrogate task to learn visual characteristics shared across classes with a separate encoder. This encoder is trained jointly with the encoder for class information by reducing their mutual information. On five standard image retrieval benchmarks the approach significantly improves upon the state-of-the-art.
updated: Wed Sep 25 2019 16:04:27 GMT+0000 (UTC)
published: Wed Sep 25 2019 16:04:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト