arXiv reaDer
NUTA:行動認識のための不均一な時間的集約
NUTA: Non-uniform Temporal Aggregation for Action Recognition
行動認識研究の世界では、入力ビデオの時空間ボリュームをモデル化するためのネットワークを構築およびトレーニングする方法に主な焦点が当てられてきました。これらの方法は通常、入力クリップのセグメントを(時間次元に沿って)均一にサンプリングします。ただし、クリップ内のアクションを決定するために、ビデオのすべての部分が等しく重要であるとは限りません。この作業では、代わりに、ビデオの最も有益な部分に焦点を合わせるために、特徴を抽出する場所の学習に焦点を合わせます。情報量の多い時間セグメントからのみ特徴を集約する、不均一時間集約(NUTA)と呼ばれる方法を提案します。また、NUTA機能を従来の均一にサンプリングされたビデオ機能と時間的に位置合わせして、ローカル機能とクリップレベル機能の両方を組み合わせることができる同期方法を紹介します。私たちのモデルは、広く使用されている4つの大規模な行動認識データセット(Kinetics400、Kinetics700、Something-something V2、およびCharades)で最先端のパフォーマンスを実現しています。さらに、提案されたNUTAメソッドがビデオクリップの最も関連性の高い部分のみを選択する方法を示す視覚化を作成しました。
In the world of action recognition research, one primary focus has been on how to construct and train networks to model the spatial-temporal volume of an input video. These methods typically uniformly sample a segment of an input clip (along the temporal dimension). However, not all parts of a video are equally important to determine the action in the clip. In this work, we focus instead on learning where to extract features, so as to focus on the most informative parts of the video. We propose a method called the non-uniform temporal aggregation (NUTA), which aggregates features only from informative temporal segments. We also introduce a synchronization method that allows our NUTA features to be temporally aligned with traditional uniformly sampled video features, so that both local and clip-level features can be combined. Our model has achieved state-of-the-art performance on four widely used large-scale action-recognition datasets (Kinetics400, Kinetics700, Something-something V2 and Charades). In addition, we have created a visualization to illustrate how the proposed NUTA method selects only the most relevant parts of a video clip.
updated: Tue Dec 15 2020 02:03:37 GMT+0000 (UTC)
published: Tue Dec 15 2020 02:03:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト