arXiv reaDer
フレーム フレキシブル ネットワーク
Frame Flexible Network
既存のビデオ認識アルゴリズムは、フレーム番号が異なる入力に対して常に異なるトレーニング パイプラインを実行します。これには、トレーニング操作の繰り返しとストレージ コストの増加が必要です。トレーニングに使用されていない他のフレームを使用してモデルを評価すると、パフォーマンスが大幅に低下することがわかります (図 1 を参照)。これは、Temporal Frequency Deviation 現象として要約されます。この問題を解決するために、Frame Flexible Network (FFN) という名前の一般的なフレームワークを提案します。これは、異なるフレームでモデルを評価して計算を調整できるようにするだけでなく、複数のモデルを保存するためのメモリ コストを大幅に削減します。具体的には、FFN はトレーニング シーケンスのいくつかのセットを統合し、Multi-Frequency Alignment (MFAL) を使用して時間周波数不変表現を学習し、Multi-Frequency Adaptation (MFAD) を活用して表現能力をさらに強化します。さまざまなアーキテクチャと一般的なベンチマークを使用した包括的な経験的検証により、FFN の有効性と一般化が確実に実証されています (たとえば、Something-Something V1 データセットでは、Uniformer よりもフレーム 4/8/16 で 7.08/5.15/2.17% のパフォーマンスが向上しています)。コードは https://github.com/BeSpontaneous/FFN で入手できます。
Existing video recognition algorithms always conduct different training pipelines for inputs with different frame numbers, which requires repetitive training operations and multiplying storage costs. If we evaluate the model using other frames which are not used in training, we observe the performance will drop significantly (see Fig.1), which is summarized as Temporal Frequency Deviation phenomenon. To fix this issue, we propose a general framework, named Frame Flexible Network (FFN), which not only enables the model to be evaluated at different frames to adjust its computation, but also reduces the memory costs of storing multiple models significantly. Concretely, FFN integrates several sets of training sequences, involves Multi-Frequency Alignment (MFAL) to learn temporal frequency invariant representations, and leverages Multi-Frequency Adaptation (MFAD) to further strengthen the representation abilities. Comprehensive empirical validations using various architectures and popular benchmarks solidly demonstrate the effectiveness and generalization of FFN (e.g., 7.08/5.15/2.17% performance gain at Frame 4/8/16 on Something-Something V1 dataset over Uniformer). Code is available at https://github.com/BeSpontaneous/FFN.
updated: Sun Mar 26 2023 20:51:35 GMT+0000 (UTC)
published: Sun Mar 26 2023 20:51:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト