arXiv reaDer
加重集計を使用したアクション品質評価の改善
Improving Action Quality Assessment using Weighted Aggregation
アクション品質評価(AQA)は、アクションのビデオに基づいて人間のアクションを自動的に判断し、それにパフォーマンススコアを割り当てることを目的としています。 AQAに関する既存の文献の大部分の作品は、RGBビデオを短いクリップに分割し、畳み込み3D(C3D)ネットワークを使用してこれらのクリップを高レベルの表現に変換し、平均化によって集約します。これらの高レベルの表現は、AQAを実行するために使用されます。平均化の現在のクリップレベルの機能集約手法は、クリップレベルの機能の相対的な重要性を把握するには不十分であることがわかります。この作業では、学習ベースの加重平均手法を提案します。この手法を使用すると、多くの計算リソースを犠牲にすることなく、より優れたパフォーマンスを得ることができます。この手法をWeight-Decider(WD)と呼びます。また、アクション品質評価のためのより良い表現を学習するために、ResNetsを実験します。畳み込みニューラルネットワークの深さと入力クリップサイズがアクションスコア予測の品質に及ぼす影響を評価します。 32フレームクリップを処理する機能を備えた34層(2 + 1)D ResNetを使用して、MTL-AQAデータセットで0.9315(0.45%の増加)の新しい最先端のスピアマンの順位相関を達成します。 WDアグリゲーション。
Action quality assessment (AQA) aims at automatically judging human action based on a video of the said action and assigning a performance score to it. The majority of works in the existing literature on AQA divide RGB videos into short clips, transform these clips to higher-level representations using Convolutional 3D (C3D) networks, and aggregate them through averaging. These higher-level representations are used to perform AQA. We find that the current clip level feature aggregation technique of averaging is insufficient to capture the relative importance of clip level features. In this work, we propose a learning-based weighted-averaging technique. Using this technique, better performance can be obtained without sacrificing too much computational resources. We call this technique Weight-Decider(WD). We also experiment with ResNets for learning better representations for action quality assessment. We assess the effects of the depth and input clip size of the convolutional neural network on the quality of action score predictions. We achieve a new state-of-the-art Spearman's rank correlation of 0.9315 (an increase of 0.45%) on the MTL-AQA dataset using a 34 layer (2+1)D ResNet with the capability of processing 32 frame clips, with WD aggregation.
updated: Fri Mar 11 2022 15:06:23 GMT+0000 (UTC)
published: Sun Feb 21 2021 08:36:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト