arXiv reaDer
ビデオコピー検出のための機能互換のプログレッシブ学習
Feature-compatible Progressive Learning for Video Copy Detection
ビデオ コピー検出 (VCD) は、未承認または複製されたビデオ コンテンツのインスタンスを識別するために開発されました。このペーパーでは、CVPR 2023 のメタ AI ビデオ類似性チャレンジ (VSC22) の 2 位のソリューションを紹介します。このチャレンジに対抗するために、VCD 向けの機能互換プログレッシブ学習 (FCPL) を提案します。 FCPL は、相互に互換性のある機能を生成するさまざまなモデルをトレーニングします。これは、複数の異なるモデルから派生した機能を相互に直接比較できることを意味します。この相互互換性により機能アンサンブルが可能になることがわかりました。プログレッシブ学習を実装し、ラベル付きのグラウンド トゥルース ペアを利用することで、パフォーマンスを効果的に徐々に向上させます。実験結果は、提案された FCPL が他の競合他社よりも優れていることを示しています。私たちのコードは https://github.com/WangWenhao0716/VSC-DescriptorTrack-Submission および https://github.com/WangWenhao0716/VSC-MatchingTrack-Submission で入手できます。
Video Copy Detection (VCD) has been developed to identify instances of unauthorized or duplicated video content. This paper presents our second place solutions to the Meta AI Video Similarity Challenge (VSC22), CVPR 2023. In order to compete in this challenge, we propose Feature-Compatible Progressive Learning (FCPL) for VCD. FCPL trains various models that produce mutually-compatible features, meaning that the features derived from multiple distinct models can be directly compared with one another. We find this mutual compatibility enables feature ensemble. By implementing progressive learning and utilizing labeled ground truth pairs, we effectively gradually enhance performance. Experimental results demonstrate the superiority of the proposed FCPL over other competitors. Our code is available at https://github.com/WangWenhao0716/VSC-DescriptorTrack-Submission and https://github.com/WangWenhao0716/VSC-MatchingTrack-Submission.
updated: Fri May 12 2023 17:26:39 GMT+0000 (UTC)
published: Thu Apr 20 2023 13:39:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト