arXiv reaDer
スポーツを通じてスケーラブルなビデオ理解ベンチマークを構築する
Building Scalable Video Understanding Benchmarks through Sports
長いビデオの理解を評価するための既存のベンチマークは、2 つの重要な側面で不足しています。これらの制限は、多くの場合、各フレームに手動でラベルを付ける必要がある長いビデオの高密度の注釈を収集するのが難しいことに起因します。この作業では、自動化された注釈とビデオ ストリーム アライメント パイプライン (略して ASAP) を紹介します。 4 つの異なるスポーツのラベルのないビデオを、対応する自由に利用できる高密度の Web 注釈 (つまり、解説) と並べることによって、ASAP の一般性を示します。次に、ASAP のスケーラビリティを活用して、大規模な長いビデオ理解ベンチマークである LCric を作成します。これは、実質的にゼロのアノテーション コストで収集された 1000 時間以上の高密度に注釈が付けられた長い Cricket ビデオ (平均サンプル長が約 50 分) です。私たちは、LCric で最先端のビデオ理解モデルをベンチマークし、分析します。これには、多数の合成マルチチョイスおよび回帰クエリが使用されます。私たちは、新しい研究が探求される大きな余地があることを示す人間のベースラインを確立します。私たちの人体研究は、ASAP が動画と注釈を高い忠実度、精度、速度で整列できることを示しています。データセットと ASAP およびベースラインのコードは、https://asap-benchmark.github.io/ からアクセスできます。
Existing benchmarks for evaluating long video understanding falls short on two critical aspects, either lacking in scale or quality of annotations. These limitations arise from the difficulty in collecting dense annotations for long videos, which often require manually labeling each frame. In this work, we introduce an automated Annotation and Video Stream Alignment Pipeline (abbreviated ASAP). We demonstrate the generality of ASAP by aligning unlabeled videos of four different sports with corresponding freely available dense web annotations (i.e. commentary). We then leverage ASAP scalability to create LCric, a large-scale long video understanding benchmark, with over 1000 hours of densely annotated long Cricket videos (with an average sample length of ~50 mins) collected at virtually zero annotation cost. We benchmark and analyze state-of-the-art video understanding models on LCric through a large set of compositional multi-choice and regression queries. We establish a human baseline that indicates significant room for new research to explore. Our human studies indicate that ASAP can align videos and annotations with high fidelity, precision, and speed. The dataset along with the code for ASAP and baselines can be accessed here: https://asap-benchmark.github.io/.
updated: Sun Mar 26 2023 08:34:56 GMT+0000 (UTC)
published: Tue Jan 17 2023 13:20:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト