コンピュータ ビジョンに適用されるディープ ラーニングの最近の開発により、スポーツ ビデオの理解が多くの注目を集め、スポーツの消費者とリーグの両方により豊富な情報が提供されるようになりました。このホワイト ペーパーでは、DeepSportradar-v1 を紹介します。DeepSportradar-v1 は、自動化されたスポーツ理解のためのコンピューター ビジョン タスク、データセット、およびベンチマークのスイートです。このフレームワークの主な目的は、学術研究と現実世界の設定との間のギャップを埋めることです。この目的のために、データセットは高解像度の生画像、カメラ パラメーター、および高品質の注釈を提供します。 DeepSportradar は現在、バスケットボールに関連する 4 つの困難なタスク (ボールの 3D ローカリゼーション、カメラのキャリブレーション、プレーヤー インスタンスのセグメンテーション、プレーヤーの再識別) をサポートしています。 4 つのタスクのそれぞれについて、データセット、目的、パフォーマンス メトリック、および提案されたベースライン メソッドの詳細な説明が提供されます。スポーツを理解するための高度な方法に関するさらなる研究を奨励するために、ACM Multimedia 2022 カンファレンスの MMSports ワークショップの一環として、参加者が上記のタスクを解決するための最先端の方法を開発する必要があるコンテストが開催されます。 4 つのデータセット、開発キット、ベースラインは公開されています。
With the recent development of Deep Learning applied to Computer Vision, sport video understanding has gained a lot of attention, providing much richer information for both sport consumers and leagues. This paper introduces DeepSportradar-v1, a suite of computer vision tasks, datasets and benchmarks for automated sport understanding. The main purpose of this framework is to close the gap between academic research and real world settings. To this end, the datasets provide high-resolution raw images, camera parameters and high quality annotations. DeepSportradar currently supports four challenging tasks related to basketball: ball 3D localization, camera calibration, player instance segmentation and player re-identification. For each of the four tasks, a detailed description of the dataset, objective, performance metrics, and the proposed baseline method are provided. To encourage further research on advanced methods for sport understanding, a competition is organized as part of the MMSports workshop from the ACM Multimedia 2022 conference, where participants have to develop state-of-the-art methods to solve the above tasks. The four datasets, development kits and baselines are publicly available.