TVAE: メトリック学習を使用したトリプレットベースの変分オートエンコーダー
TVAE: Triplet-Based Variational Autoencoder using Metric Learning
ディープ メトリック学習は、メトリック学習から学習した埋め込みに依存することにより、データの類似性を測定するために使用できるセマンティック表現とエンコード情報の学習に非常に効果的であることが実証されています。同時に、変分オートエンコーダー (VAE) は近似推論に広く使用されており、有向確率モデルで優れたパフォーマンスを発揮することが証明されています。ただし、従来の VAE の場合、データ ラベルまたは特徴情報は扱いにくいものです。同様に、従来の表現学習アプローチでは、データの多くの顕著な側面を表現できません。このプロジェクトでは、深層計量学習を組み込むことにより、VAE に潜在的な埋め込みを学習するための新しい統合フレームワークを提案します。機能は、VAE の標準証拠下限 (ELBO) と組み合わせて、VAE の平均ベクトルのトリプレット損失を最適化することによって学習されます。トリプレット ベースの変分オートエンコーダー (TVAE) と呼ばれるこのアプローチにより、潜在的な埋め込みでより詳細な情報を取得できます。私たちのモデルは MNIST データセットでテストされ、従来の VAE (Kingma & Welling, 2013) が 75.08% のトリプレット精度を達成するのに対し、95.60% の高いトリプレット精度を達成します。
Deep metric learning has been demonstrated to be highly effective in learning semantic representation and encoding information that can be used to measure data similarity, by relying on the embedding learned from metric learning. At the same time, variational autoencoder (VAE) has widely been used to approximate inference and proved to have a good performance for directed probabilistic models. However, for traditional VAE, the data label or feature information are intractable. Similarly, traditional representation learning approaches fail to represent many salient aspects of the data. In this project, we propose a novel integrated framework to learn latent embedding in VAE by incorporating deep metric learning. The features are learned by optimizing a triplet loss on the mean vectors of VAE in conjunction with standard evidence lower bound (ELBO) of VAE. This approach, which we call Triplet based Variational Autoencoder (TVAE), allows us to capture more fine-grained information in the latent embedding. Our model is tested on MNIST data set and achieves a high triplet accuracy of 95.60% while the traditional VAE (Kingma & Welling, 2013) achieves triplet accuracy of 75.08%.
updated: Wed Feb 08 2023 15:25:57 GMT+0000 (UTC)
published: Tue Feb 13 2018 00:05:19 GMT+0000 (UTC)
