arXiv reaDer
きめ細かいビデオ理解のための時間クエリネットワーク
Temporal Query Networks for Fine-grained Video Understanding
この作業の目的は、トリミングされていないビデオのアクションをきめ細かく分類することです。アクションは、一時的に拡張される場合と、ビデオの数フレームのみにまたがる場合があります。これをクエリ応答メカニズムにキャストします。各クエリは特定の質問に対応し、独自の応答ラベルが設定されています。私たちは次の4つの貢献をします。(I)クエリ応答機能ときめ細かいアクションの構造的理解を可能にする新しいモデルであるTemporal QueryNetworkを提案します。これは、一時的な注意メカニズムを使用して各クエリの関連セグメントに対応し、各クエリのラベルのみを使用してトレーニングできます。 (ii)きめ細かいクエリに応答するために必要な高密度サンプリングを使用して、さまざまな長さのビデオでネットワークをトレーニングするための新しい方法(確率的機能バンクの更新)を提案します。 (iii)TQNを他のアーキテクチャやテキスト監視方法と比較し、それらの長所と短所を分析します。最後に、(iv)FineGymおよびDiving48ベンチマークでメソッドを広範囲に評価して、きめ細かいアクション分類を行い、RGB機能のみを使用して最先端を超えています。
Our objective in this work is fine-grained classification of actions in untrimmed videos, where the actions may be temporally extended or may span only a few frames of the video. We cast this into a query-response mechanism, where each query addresses a particular question, and has its own response label set. We make the following four contributions: (I) We propose a new model - a Temporal Query Network - which enables the query-response functionality, and a structural understanding of fine-grained actions. It attends to relevant segments for each query with a temporal attention mechanism, and can be trained using only the labels for each query. (ii) We propose a new way - stochastic feature bank update - to train a network on videos of various lengths with the dense sampling required to respond to fine-grained queries. (iii) We compare the TQN to other architectures and text supervision methods, and analyze their pros and cons. Finally, (iv) we evaluate the method extensively on the FineGym and Diving48 benchmarks for fine-grained action classification and surpass the state-of-the-art using only RGB features.
updated: Mon Apr 19 2021 17:58:48 GMT+0000 (UTC)
published: Mon Apr 19 2021 17:58:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト