arXiv reaDer
Tiny Actions Challenge のための低解像度アクション認識
Low-Resolution Action Recognition for Tiny Actions Challenge
Tiny Actions Challenge は、現実世界の監視における人間の活動を理解することに焦点を当てています。基本的に、このシナリオでのアクティビティ認識には 2 つの主な問題があります。第 1 に、人間の活動は離れた場所で記録されることが多く、識別可能な手がかりがほとんどない小さな解像度で表示されます。第二に、これらの活動は自然にロングテール方式で分散されます。このようなカテゴリの不均衡が大きいため、データの偏りを緩和することは困難です。これらの問題に取り組むために、この論文では包括的な認識ソリューションを提案します。まず、チャレンジ ベンチマークでのオーバーフィッティングを軽減するために、データ バランスを使用してビデオ バックボーンをトレーニングします。第二に、超解像度知識による低解像度アクション認識を効果的に導くことができるデュアル解像度蒸留フレームワークを設計します。最後に、後処理を伴うモデル アンサンブルを適用します。これにより、ロングテール カテゴリのパフォーマンスがさらに向上します。当社のソリューションはリーダーボードでトップ 1 にランクされています。
Tiny Actions Challenge focuses on understanding human activities in real-world surveillance. Basically, there are two main difficulties for activity recognition in this scenario. First, human activities are often recorded at a distance, and appear in a small resolution without much discriminative clue. Second, these activities are naturally distributed in a long-tailed way. It is hard to alleviate data bias for such heavy category imbalance. To tackle these problems, we propose a comprehensive recognition solution in this paper. First, we train video backbones with data balance, in order to alleviate overfitting in the challenge benchmark. Second, we design a dual-resolution distillation framework, which can effectively guide low-resolution action recognition by super-resolution knowledge. Finally, we apply model en-semble with post-processing, which can further boost per-formance on the long-tailed categories. Our solution ranks Top-1 on the leaderboard.
updated: Wed Sep 28 2022 00:49:13 GMT+0000 (UTC)
published: Wed Sep 28 2022 00:49:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト