arXiv reaDer
TEACHTEXT:テキスト-ビデオ検索のためのCrossModal一般化蒸留
TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval
近年、強力なビデオエンコーダーを構築するために、ビジュアルおよびオーディオデータセットの大規模な事前トレーニングを活用することにより、テキストビデオ検索のタスクでかなりの進歩が達成されました。対照的に、自然な対称性にもかかわらず、大規模な言語の事前トレーニングを活用するための効果的なアルゴリズムの設計は未踏のままです。この作業では、このようなアルゴリズムの設計を調査し、新しい一般化された蒸留方法であるTeachTextを提案します。これは、複数のテキストエンコーダーからの補完的な手がかりを活用して、検索モデルに強化された監視信号を提供します。さらに、この方法をビデオ側のモダリティに拡張し、パフォーマンスを損なうことなく、テスト時に使用されるモダリティの数を効果的に削減できることを示します。私たちのアプローチは、いくつかのビデオ検索ベンチマークの最先端を大幅に進歩させ、テスト時に計算のオーバーヘッドを追加しません。大事なことを言い忘れましたが、検索データセットからノイズを除去するための私たちの方法の効果的なアプリケーションを示します。コードとデータはhttps://www.robots.ox.ac.uk/~vgg/research/teachtext/にあります。
In recent years, considerable progress on the task of text-video retrieval has been achieved by leveraging large-scale pretraining on visual and audio datasets to construct powerful video encoders. By contrast, despite the natural symmetry, the design of effective algorithms for exploiting large-scale language pretraining remains under-explored. In this work, we are the first to investigate the design of such algorithms and propose a novel generalized distillation method, TeachText, which leverages complementary cues from multiple text encoders to provide an enhanced supervisory signal to the retrieval model. Moreover, we extend our method to video side modalities and show that we can effectively reduce the number of used modalities at test time without compromising performance. Our approach advances the state of the art on several video retrieval benchmarks by a significant margin and adds no computational overhead at test time. Last but not least, we show an effective application of our method for eliminating noise from retrieval datasets. Code and data can be found at https://www.robots.ox.ac.uk/~vgg/research/teachtext/.
updated: Fri Apr 16 2021 17:55:28 GMT+0000 (UTC)
published: Fri Apr 16 2021 17:55:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト