arXiv reaDer
アソシエーション フットボール ビデオにおけるアクション スポッティングのアクティブ ラーニングに向けて
Towards Active Learning for Action Spotting in Association Football Videos
アソシエーション フットボールは複雑でダイナミックなスポーツであり、各ゲームで多数のアクションが同時に発生します。サッカー ビデオの分析は難しく、微妙で多様な時空間パターンを特定する必要があります。コンピューター ビジョンの最近の進歩にもかかわらず、現在のアルゴリズムは、限られた注釈付きデータから学習する際に依然として大きな課題に直面しており、これらのパターンを検出するパフォーマンスが低下しています。このホワイトペーパーでは、次に注釈を付ける最も有益なビデオサンプルを選択するアクティブラーニングフレームワークを提案します。これにより、注釈の労力が大幅に削減され、アクションスポッティングモデルのトレーニングが加速され、より速いペースで最高の精度に到達します。私たちのアプローチは、不確実性サンプリングの概念を活用して、次にトレーニングする最も困難なビデオ クリップを選択し、アルゴリズムの学習プロセスを早めます。提案したアクティブ ラーニング フレームワークが、サッカー ビデオでの正確なアクション スポッティングに必要なトレーニング データを効果的に削減することを示します。データセットの 3 分の 1 のみを使用して、SoccerNet-v2 で NetVLAD++ を使用したアクション スポッティングで同様のパフォーマンスを達成しました。これは、アノテーション時間を短縮し、データ効率を改善するための重要な機能を示しています。さらに、ヘッダーとパスのアクションを一時的にローカライズすることに焦点を当てた 2 つの新しいデータセットに対するアプローチを検証し、サッカーのさまざまなアクション セマンティクスにわたってその有効性を証明します。アクション スポッティング用のアクティブ ラーニング フレームワークは、アクション スポッティング アルゴリズムのさらなるアプリケーションをサポートし、スポーツ ドメインでのアノテーション キャンペーンを加速すると考えています。
Association football is a complex and dynamic sport, with numerous actions occurring simultaneously in each game. Analyzing football videos is challenging and requires identifying subtle and diverse spatio-temporal patterns. Despite recent advances in computer vision, current algorithms still face significant challenges when learning from limited annotated data, lowering their performance in detecting these patterns. In this paper, we propose an active learning framework that selects the most informative video samples to be annotated next, thus drastically reducing the annotation effort and accelerating the training of action spotting models to reach the highest accuracy at a faster pace. Our approach leverages the notion of uncertainty sampling to select the most challenging video clips to train on next, hastening the learning process of the algorithm. We demonstrate that our proposed active learning framework effectively reduces the required training data for accurate action spotting in football videos. We achieve similar performances for action spotting with NetVLAD++ on SoccerNet-v2, using only one-third of the dataset, indicating significant capabilities for reducing annotation time and improving data efficiency. We further validate our approach on two new datasets that focus on temporally localizing actions of headers and passes, proving its effectiveness across different action semantics in football. We believe our active learning framework for action spotting would support further applications of action spotting algorithms and accelerate annotation campaigns in the sports domain.
updated: Sun Apr 09 2023 11:50:41 GMT+0000 (UTC)
published: Sun Apr 09 2023 11:50:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト