arXiv reaDer
ビデオ アクション認識用ゲート シフト ヒューズ
Gate-Shift-Fuse for Video Action Recognition
畳み込みニューラル ネットワークは、画像認識の事実上のモデルです。ただし、ビデオ認識のための 2D CNN の単純な拡張である 3D CNN は、標準的なアクション認識ベンチマークでは同じ成功を収めていません。このように 3D CNN のパフォーマンスが低下する主な理由の 1 つは、大規模なアノテーション付きデータセットを大規模にトレーニングする必要があるため、計算が複雑になることです。 3D CNN の複雑さを軽減するために、3D カーネル因数分解アプローチが提案されています。既存のカーネル因数分解アプローチは、手作業で設計されたハードワイヤードの手法に従います。このホワイト ペーパーでは、Gate-Shift-Fuse (GSF) を提案します。これは、時空間分解における相互作用を制御し、時間をかけて特徴を適応的にルーティングし、それらをデータ依存の方法で結合することを学習する、新しい時空間特徴抽出モジュールです。 GSF は、グループ化された空間ゲーティングを利用して入力テンソルを分解し、チャネルの重み付けを利用して分解されたテンソルを融合します。 GSF を既存の 2D CNN に挿入して、それらを効率的で高性能な時空間特徴抽出器に変換できます。パラメーターと計算オーバーヘッドは無視できます。 2 つの一般的な 2D CNN ファミリを使用して GSF の広範な分析を実行し、5 つの標準アクション認識ベンチマークで最先端または競争力のあるパフォーマンスを達成します。
Convolutional Neural Networks are the de facto models for image recognition. However 3D CNNs, the straight forward extension of 2D CNNs for video recognition, have not achieved the same success on standard action recognition benchmarks. One of the main reasons for this reduced performance of 3D CNNs is the increased computational complexity requiring large scale annotated datasets to train them in scale. 3D kernel factorization approaches have been proposed to reduce the complexity of 3D CNNs. Existing kernel factorization approaches follow hand-designed and hard-wired techniques. In this paper we propose Gate-Shift-Fuse (GSF), a novel spatio-temporal feature extraction module which controls interactions in spatio-temporal decomposition and learns to adaptively route features through time and combine them in a data dependent manner. GSF leverages grouped spatial gating to decompose input tensor and channel weighting to fuse the decomposed tensors. GSF can be inserted into existing 2D CNNs to convert them into an efficient and high performing spatio-temporal feature extractor, with negligible parameter and compute overhead. We perform an extensive analysis of GSF using two popular 2D CNN families and achieve state-of-the-art or competitive performance on five standard action recognition benchmarks.
updated: Sat Apr 15 2023 13:06:27 GMT+0000 (UTC)
published: Wed Mar 16 2022 19:19:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト