arXiv reaDer
コンテンツベースの画像検索のためのクラス固有変分自動エンコーダ
Class-Specific Variational Auto-Encoder for Content-Based Image Retrieval
教師あり深層学習法によって得られた識別表現を使用すると、さまざまなコンテンツベースの画像検索 (CBIR) の問題で有望な結果が得られました。ただし、トレーニング中にラベルを利用する既存の方法は、利用可能なすべてのクラスを識別しようとします。これは、検索の問題が対象のクラスに焦点を当てている場合には理想的ではありません。この論文では、Variational Auto-Encoders (VAE) の正則化された損失を提案し、モデルが対象の特定のクラスに集中するように強制します。その結果、モデルは、対象のクラスに属するデータを他の可能性から識別することを学習し、学習した VAE の潜在空間をクラス固有の検索タスクに適したものにします。提案された Class-Specific Variational Auto-Encoder (CS-VAE) は、3 つのパブリック データセットと 1 つのカスタム データセットで評価され、そのパフォーマンスは 3 つの関連する VAE ベースの方法と比較されます。実験結果は、提案された方法が、ドメイン内およびドメイン外の検索問題の両方で競合他社よりも優れていることを示しています。
Using a discriminative representation obtained by supervised deep learning methods showed promising results on diverse Content-Based Image Retrieval (CBIR) problems. However, existing methods exploiting labels during training try to discriminate all available classes, which is not ideal in cases where the retrieval problem focuses on a class of interest. In this paper, we propose a regularized loss for Variational Auto-Encoders (VAEs) forcing the model to focus on a given class of interest. As a result, the model learns to discriminate the data belonging to the class of interest from any other possibility, making the learnt latent space of the VAE suitable for class-specific retrieval tasks. The proposed Class-Specific Variational Auto-Encoder (CS-VAE) is evaluated on three public and one custom datasets, and its performance is compared with that of three related VAE-based methods. Experimental results show that the proposed method outperforms its competition in both in-domain and out-of-domain retrieval problems.
updated: Sun Apr 23 2023 19:51:25 GMT+0000 (UTC)
published: Sun Apr 23 2023 19:51:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト