arXiv reaDer
SegTAD:セマンティックセグメンテーションによる正確な時間的アクションの検出
SegTAD: Precise Temporal Action Detection via Semantic Segmentation
時間的アクション検出(TAD)は、ビデオ分析において重要でありながら困難なタスクです。ほとんどの既存の作品は、画像オブジェクトの検出からインスピレーションを得て、それを提案の生成、つまり分類の問題として再定式化する傾向があります。ただし、このパラダイムには2つの注意点があります。まず、提案には注釈付きのラベルが装備されていないため、経験的にコンパイルする必要があります。したがって、注釈内の情報は、モデルのトレーニングプロセスで必ずしも正確に使用されるとは限りません。第二に、アクションの時間的スケールには大きなばらつきがあり、この事実を無視すると、ビデオ機能の表現が不十分になる可能性があります。これらの問題に対処し、時間的アクション検出を正確にモデル化するために、セマンティックセグメンテーションの新しい視点で時間的アクション検出のタスクを定式化します。 TADの1次元プロパティにより、粗粒度の検出アノテーションを細粒度のセマンティックセグメンテーションアノテーションに無料で変換できます。私たちはそれらを利用して正確な監督を提供し、不正確な提案ラベルによって引き起こされる影響を軽減します。 1Dセマンティックセグメンテーションネットワーク(1D-SSN)と提案検出ネットワーク(PDN)で構成されるエンドツーエンドのフレームワークSegTADを提案します。
Temporal action detection (TAD) is an important yet challenging task in video analysis. Most existing works draw inspiration from image object detection and tend to reformulate it as a proposal generation - classification problem. However, there are two caveats with this paradigm. First, proposals are not equipped with annotated labels, which have to be empirically compiled, thus the information in the annotations is not necessarily precisely employed in the model training process. Second, there are large variations in the temporal scale of actions, and neglecting this fact may lead to deficient representation in the video features. To address these issues and precisely model temporal action detection, we formulate the task of temporal action detection in a novel perspective of semantic segmentation. Owing to the 1-dimensional property of TAD, we are able to convert the coarse-grained detection annotations to fine-grained semantic segmentation annotations for free. We take advantage of them to provide precise supervision so as to mitigate the impact induced by the imprecise proposal labels. We propose an end-to-end framework SegTAD composed of a 1D semantic segmentation network (1D-SSN) and a proposal detection network (PDN).
updated: Thu Mar 03 2022 06:52:13 GMT+0000 (UTC)
published: Thu Mar 03 2022 06:52:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト