arXiv reaDer
ConaCLIP: 軽量のテキストと画像の検索のための完全に接続された知識インタラクション グラフの蒸留の探索
ConaCLIP: Exploring Distillation of Fully-Connected Knowledge Interaction Graph for Lightweight Text-Image Retrieval
デュアル エンコーダ アーキテクチャ (CLIP など) を備えた大規模な事前トレーニング済みテキスト画像モデルは、通常、テキスト画像検索を含むさまざまな視覚言語アプリケーションに採用されています。ただし、これらのモデルは、インデックス作成と推論に時間がかかり、計算リソースが大量に消費されるため、エッジ デバイスやリアルタイムの状況ではまだ実用的ではありません。知識蒸留技術はユニモーダルモデル圧縮に広く利用されてきましたが、モダリティと教師/生徒の数が 2 倍になった状況にそれを拡張する方法はほとんど研究されていません。この論文では、このトピックに関する包括的な実験を実施し、クロスモーダル事前トレーニング蒸留のための完全に接続された知識インタラクション グラフ (Cona) 手法を提案します。私たちの調査結果に基づいて、結果として得られる ConaCLIP は、軽量設定下で広く使用されている Flickr30K および MSCOCO ベンチマークで SOTA パフォーマンスを達成します。電子商取引プラットフォーム上で当社の手法を業界に適用すると、ConaCLIP の重要な有効性がさらに実証されます。
Large-scale pre-trained text-image models with dual-encoder architectures (such as CLIP) are typically adopted for various vision-language applications, including text-image retrieval. However,these models are still less practical on edge devices or for real-time situations, due to the substantial indexing and inference time and the large consumption of computational resources. Although knowledge distillation techniques have been widely utilized for uni-modal model compression, how to expand them to the situation when the numbers of modalities and teachers/students are doubled has been rarely studied. In this paper, we conduct comprehensive experiments on this topic and propose the fully-Connected knowledge interaction graph (Cona) technique for cross-modal pre-training distillation. Based on our findings, the resulting ConaCLIP achieves SOTA performances on the widely-used Flickr30K and MSCOCO benchmarks under the lightweight setting. An industry application of our method on an e-commercial platform further demonstrates the significant effectiveness of ConaCLIP.
updated: Sun May 28 2023 07:16:44 GMT+0000 (UTC)
published: Sun May 28 2023 07:16:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト