arXiv reaDer
オクルージョンビデオにグループスパース性を使用したロバストな歩行者属性認識
Robust Pedestrian Attribute Recognition Using Group Sparsity for Occlusion Videos
閉塞処理は、歩行者属性認識(PAR)の重要な問題です。それにもかかわらず、いくつかの既存のビデオベースのPARメソッドは、オクルージョン処理を詳細に検討していません。この論文では、混雑したビデオのスパース性に基づく時間的注意として、遮蔽されていないフレームを見つけることを定式化します。このようにして、モデルは、遮蔽されたフレームに注意を払わないように誘導されます。ただし、時間的スパース性には、オクルージョンが発生したときの属性間の相関関係を含めることはできません。たとえば、足が見えないときは「ブーツ」や「靴の色」は認識できません。無相関注意の問題を解決するために、新しいグループスパース性ベースの時間的注意モジュールも提案します。グループのスパース性は、相関属性の注意の重み全体に適用されます。したがって、グループ内の注意の重みは、同じフレームに注意を払うことを余儀なくされます。実験結果は、提案された方法が、2つのビデオベースのPARデータセットと5つのオクルージョンシナリオで最先端の方法よりも高いF1スコアを達成したことを示しました。
Occlusion processing is a key issue in pedestrian attribute recognition (PAR). Nevertheless, several existing video-based PAR methods have not yet considered occlusion handling in depth. In this paper, we formulate finding non-occluded frames as sparsity-based temporal attention of a crowded video. In this manner, a model is guided not to pay attention to the occluded frame. However, temporal sparsity cannot include a correlation between attributes when occlusion occurs. For example, "boots" and "shoe color" cannot be recognized when the foot is invisible. To solve the uncorrelated attention issue, we also propose a novel group sparsity-based temporal attention module. Group sparsity is applied across attention weights in correlated attributes. Thus, attention weights in a group are forced to pay attention to the same frames. Experimental results showed that the proposed method achieved a higher F1-score than the state-of-the-art methods on two video-based PAR datasets and five occlusion scenarios.
updated: Sun Oct 17 2021 03:19:39 GMT+0000 (UTC)
published: Sun Oct 17 2021 03:19:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト