arXiv reaDer
画像検索のためのコンテキストを認識しない知識の抽出
Context Unaware Knowledge Distillation for Image Retrieval
既存のデータ依存ハッシュ法は、数百万のパラメーターを持つ大規模なバックボーンネットワークを使用し、計算が複雑です。既存の知識蒸留方法は、ロジットやその他のディープ(教師)モデルの機能を使用し、コンパクト(学生)モデルの知識として使用します。これには、コンテキストの学生モデルと並行して、教師のネットワークをコンテキストで微調整する必要があります。ターゲットコンテキストで教師をトレーニングするには、より多くの時間と計算リソースが必要です。本論文では、ターゲットコンテキストで微調整せずに教師モデルの知識を使用するコンテキスト非認識知識蒸留を提案します。また、知識蒸留のための新しい効率的な学生モデルアーキテクチャを提案します。提案されたアプローチは、2段階のプロセスに従います。最初のステップは、教師モデルからのコンテキスト認識のない知識の蒸留の助けを借りて、学生モデルを事前にトレーニングすることを含みます。 2番目のステップでは、画像検索のコンテキストで学生モデルを微調整します。提案されたアプローチの有効性を示すために、検索結果を比較します。パラメータの数といいえ。ディープコーシーハッシュ(DCH)や中央類似性量子化(CSQ)など、さまざまな検索フレームワークでの教師モデルを使用した学生モデルの操作の比較。実験結果は、提案されたアプローチが検索結果と効率の間の有望なトレードオフを提供することを確認します。このホワイトペーパーで使用されているコードは、https://github.com/satoru2001/CUKDFIRで公開されています。
Existing data-dependent hashing methods use large backbone networks with millions of parameters and are computationally complex. Existing knowledge distillation methods use logits and other features of the deep (teacher) model and as knowledge for the compact (student) model, which requires the teacher's network to be fine-tuned on the context in parallel with the student model on the context. Training teacher on the target context requires more time and computational resources. In this paper, we propose context unaware knowledge distillation that uses the knowledge of the teacher model without fine-tuning it on the target context. We also propose a new efficient student model architecture for knowledge distillation. The proposed approach follows a two-step process. The first step involves pre-training the student model with the help of context unaware knowledge distillation from the teacher model. The second step involves fine-tuning the student model on the context of image retrieval. In order to show the efficacy of the proposed approach, we compare the retrieval results, no. of parameters and no. of operations of the student models with the teacher models under different retrieval frameworks, including deep cauchy hashing (DCH) and central similarity quantization (CSQ). The experimental results confirm that the proposed approach provides a promising trade-off between the retrieval results and efficiency. The code used in this paper is released publicly at https://github.com/satoru2001/CUKDFIR.
updated: Tue Jul 19 2022 04:51:39 GMT+0000 (UTC)
published: Tue Jul 19 2022 04:51:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト