arXiv reaDer
実行可能セットへの交互射影によるディープメトリックラーニング
Deep Metric Learning with Alternating Projections onto Feasible Sets
 距離計量学習のためのネットワークのトレーニング中、典型的な損失関数の最小化は、トレーニングデータによって課せられた制約のセットを満たす「実行可能ポイント」と見なすことができます。この目的のために、距離データの学習問題を、トレーニングデータの埋め込みベクトルがクラス内およびクラス間の所望の近接性を満たす制約セットの実行可能ポイントを見つけることとして再定式化します。制約セットによって誘導される実行可能セットは、トレーニングデータの特定のサンプル(各クラスのサンプル)のみに近接制約を適用する、緩和された実行可能セットの共通部分として表されます。次に、実行可能点の問題は、それらの実行可能セットに対して交互に投影を実行することにより、ほぼ解決されます。このようなアプローチは、正則化の用語を導入し、体系的なバッチセット構築により典型的な損失関数を最小化します。これらのバッチは、特定の反復回数で各クラスの同じサンプルを含むように制限されます。さらに、これらの特定のサンプルはクラスの代表と見なすことができ、バッチ構築中にハードクラスマイニングを効率的に利用できます。提案された手法は、広く受け入れられている損失で適用され、画像検索とクラスタリングのためのスタンフォードオンライン製品、CAR196およびCUB200-2011データセットで評価されます。提案されたアプローチは、最先端の性能を超えて、追加の計算コストなしで統合損失関数のパフォーマンスを一貫して改善し、ハードネガティブクラスマイニングによってパフォーマンスをさらに向上させます。
During the training of networks for distance metric learning, minimizers of the typical loss functions can be considered as "feasible points" satisfying a set of constraints imposed by the training data. To this end, we reformulate distance metric learning problem as finding a feasible point of a constraint set where the embedding vectors of the training data satisfy desired intra-class and inter-class proximity. The feasible set induced by the constraint set is expressed as the intersection of the relaxed feasible sets which enforce the proximity constraints only for particular samples (a sample from each class) of the training data. Then, the feasible point problem is to be approximately solved by performing alternating projections onto those feasible sets. Such an approach introduces a regularization term and results in minimizing a typical loss function with a systematic batch set construction where these batches are constrained to contain the same sample from each class for a certain number of iterations. Moreover, these particular samples can be considered as the class representatives, allowing efficient utilization of hard class mining during batch construction. The proposed technique is applied with the well-accepted losses and evaluated on Stanford Online Products, CAR196 and CUB200-2011 datasets for image retrieval and clustering. Outperforming state-of-the-art, the proposed approach consistently improves the performance of the integrated loss functions with no additional computational cost and boosts the performance further by hard negative class mining.
updated: Wed Dec 15 2021 21:10:44 GMT+0000 (UTC)
published: Wed Jul 17 2019 15:29:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト