arXiv reaDer
VideoLT:大規模なロングテールビデオ認識
VideoLT: Large-scale Long-tailed Video Recognition
実世界でのラベル分布は、多くの場合、ロングテールで不均衡であり、その結果、モデルが優勢なラベルに偏っています。ロングテール認識は画像分類タスクのために広く研究されてきましたが、ビデオドメインのために限られた努力がなされてきました。本稿では、実世界のビデオ認識に向けた一歩として、大規模なロングテールビデオ認識データセットであるVideoLTを紹介します。 VideoLTには、トリミングされていない256,218本のビデオが含まれており、ロングテール分布の1,004クラスに注釈が付けられています。広範な研究を通じて、ロングテール画像認識に使用される最先端の方法は、ビデオデータの追加の時間的次元のために、ビデオドメインではうまく機能しないことを示しています。これにより、ロングテールのビデオ認識タスクのためのシンプルで効果的な方法であるFrameStackを提案するようになりました。特に、FrameStackはクラス分布のバランスをとるためにフレームレベルでサンプリングを実行し、サンプリング率はトレーニング中にネットワークから得られた知識を使用して動的に決定されます。実験結果は、FrameStackが全体的な精度を犠牲にすることなく分類パフォーマンスを改善できることを示しています。コードとデータセットは、https://github.com/17Skye17/VideoLTで入手できます。
Label distributions in real-world are oftentimes long-tailed and imbalanced, resulting in biased models towards dominant labels. While long-tailed recognition has been extensively studied for image classification tasks, limited effort has been made for video domain. In this paper, we introduce VideoLT, a large-scale long-tailed video recognition dataset, as a step toward real-world video recognition. Our VideoLT contains 256,218 untrimmed videos, annotated into 1,004 classes with a long-tailed distribution. Through extensive studies, we demonstrate that state-of-the-art methods used for long-tailed image recognition do not perform well in the video domain due to the additional temporal dimension in video data. This motivates us to propose FrameStack, a simple yet effective method for long-tailed video recognition task. In particular, FrameStack performs sampling at the frame-level in order to balance class distributions, and the sampling ratio is dynamically determined using knowledge derived from the network during training. Experimental results demonstrate that FrameStack can improve classification performance without sacrificing overall accuracy. Code and dataset are available at: https://github.com/17Skye17/VideoLT.
updated: Wed Aug 18 2021 06:53:40 GMT+0000 (UTC)
published: Thu May 06 2021 13:47:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト