arXiv reaDer
クロスシナリオビデオの時間的接地のためのサンプルの重要性の学習
Learning Sample Importance for Cross-Scenario Video Temporal Grounding
時間的グラウンディングのタスクは、特定のセンテンスクエリを使用して、トリミングされていないビデオ内のビデオモーメントを特定することを目的としています。この論文は、初めて、一時的な接地タスクに固有のいくつかの表面的なバイアスを調査し、新しいターゲットソリューションを提案します。最も驚くべきことに、既存の時間的地上モデルは、視覚的モーダルのいくつかのバイアス(たとえば、頻繁な概念または特定の時間的間隔に対する高い優先度)に大きく依存していることがわかります。これにより、クロスシナリオテスト設定でモデルを一般化するときにパフォーマンスが低下します。この目的のために、モデルがバイアスを素朴に記憶するのを防ぎ、真のインターモーダル関係に基づいてクエリ文を接地するように強制する、Debiased Temporal Language Localizer(DebiasTLL)と呼ばれる新しい方法を提案します。 Debias-TLLは2つのモデルを同時にトレーニングします。私たちの設計では、サンプルを判断する際のこれら2つのモデルの予測の大きな不一致は、偏ったサンプルである可能性が高いことを示しています。有益な不一致を利用して、データの偏りを軽減するためのデータ再計量スキームを考案します。列車/テストデータが不均一に供給される、クロスシナリオの時間的接地で提案されたモデルを評価します。実験は、最先端の競合他社と比較して、提案された方法の大きなマージンの優位性を示しています。
The task of temporal grounding aims to locate video moment in an untrimmed video, with a given sentence query. This paper for the first time investigates some superficial biases that are specific to the temporal grounding task, and proposes a novel targeted solution. Most alarmingly, we observe that existing temporal ground models heavily rely on some biases (e.g., high preference on frequent concepts or certain temporal intervals) in the visual modal. This leads to inferior performance when generalizing the model in cross-scenario test setting. To this end, we propose a novel method called Debiased Temporal Language Localizer (DebiasTLL) to prevent the model from naively memorizing the biases and enforce it to ground the query sentence based on true inter-modal relationship. Debias-TLL simultaneously trains two models. By our design, a large discrepancy of these two models' predictions when judging a sample reveals higher probability of being a biased sample. Harnessing the informative discrepancy, we devise a data re-weighing scheme for mitigating the data biases. We evaluate the proposed model in cross-scenario temporal grounding, where the train / test data are heterogeneously sourced. Experiments show large-margin superiority of the proposed method in comparison with state-of-the-art competitors.
updated: Sat Jan 08 2022 15:41:38 GMT+0000 (UTC)
published: Sat Jan 08 2022 15:41:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト