FineAction: A Fined Video Dataset for Temporal Action Localization
既存のベンチマークデータセットであるTHUMOS14とActivityNetでは、時間的アクションのローカリゼーション手法が大きな成功を収めています。ただし、アクションのソースが単一である、THUMOS14にはスポーツカテゴリしかない、ActivityNetおよびHACSセグメントの境界が不確実な粗いインスタンスが提案の生成と動作予測に干渉するなど、いくつかの問題がまだ存在します。時間的アクションのローカリゼーションを新しいレベルに引き上げるために、既存のビデオデータセットとWebビデオから収集された新しい大規模なファインビデオデータセットであるFineActionを開発します。全体として、このデータセットには、106のアクションカテゴリにまたがるほぼ17Kのトリミングされていないビデオに密に注釈が付けられた139Kの罰金アクションインスタンスが含まれています。 FineActionには、既存のアクションローカリゼーションデータセットと比較して、境界の不確実性を減らすために、アクションカテゴリと高品質の注釈のより細かい定義があります。データセットの時間的アクションローカリゼーションの代表的な方法を体系的に調査し、さらに分析していくつかの興味深い発見を取得します。実験結果は、FineActionが、より短い期間で、罰金およびマルチラベルインスタンスでのアクションのローカリゼーションに新たな課題をもたらすことを明らかにしています。このデータセットは将来公開される予定であり、FineActionが一時的なアクションのローカリゼーションに向けて研究を進めることができることを願っています。データセットのウェブサイトはです。
On the existing benchmark datasets, THUMOS14 and ActivityNet, temporal action localization techniques have achieved great success. However, there are still existing some problems, such as the source of the action is too single, there are only sports categories in THUMOS14, coarse instances with uncertain boundaries in ActivityNet and HACS Segments interfering with proposal generation and behavior prediction. To take temporal action localization to a new level, we develop FineAction, a new large-scale fined video dataset collected from existing video datasets and web videos. Overall, this dataset contains 139K fined action instances densely annotated in almost 17K untrimmed videos spanning 106 action categories. FineAction has a more fined definition of action categories and high-quality annotations to reduce the boundary uncertainty compared to the existing action localization datasets. We systematically investigate representative methods of temporal action localization on our dataset and obtain some interesting findings with further analysis. Experimental results reveal that our FineAction brings new challenges for action localization on fined and multi-label instances with shorter duration. This dataset will be public in the future and we hope our FineAction could advance research towards temporal action localization. Our dataset website is at
updated: Mon May 24 2021 06:06:32 GMT+0000 (UTC)
published: Mon May 24 2021 06:06:32 GMT+0000 (UTC)
