arXiv reaDer
社会的相互作用における身体行動:新しい注釈と最先端の評価
Bodily Behaviors in Social Interaction: Novel Annotations and State-of-the-Art Evaluation
ボディランゲージは人目を引く社会的信号であり、その自動分析は人工知能システムを大幅に進歩させ、社会的相互作用を理解し、積極的に参加することができます。コンピュータビジョンは、頭や体のポーズ推定などの低レベルのタスクで目覚ましい進歩を遂げましたが、ジェスチャー、身だしなみ、手探りなどのより微妙な行動の検出は十分に検討されていません。この論文では、BBSIを紹介します。これは、グループ設定での継続的な社会的相互作用に埋め込まれた複雑な身体行動の注釈の最初のセットです。心理学の以前の研究に基づいて、MPIIGroupInteractionデータセット内の26時間の自発的な人間の行動に、15の異なるボディランゲージクラスで手動で注釈を付けました。結果のデータセットと注釈品質評価の結果に関する包括的な記述統計を提示します。これらの行動を自動的に検出するために、人間の行動を検出するための最先端のアプローチであるピラミッド拡張注意ネットワーク(PDAN)を採用しています。 PDANへの入力として時空間機能の4つのバリアント、2ストリーム膨張3D CNN、時間セグメントネットワーク、時間シフトモジュール、およびSwinTransformerを使用して実験を実行します。結果は有望であり、この困難な課題を改善するための大きな余地があることを示しています。社会的行動の自動理解に向けたパズルの重要な部分を表すBBSIは、研究コミュニティが完全に利用できます。
Body language is an eye-catching social signal and its automatic analysis can significantly advance artificial intelligence systems to understand and actively participate in social interactions. While computer vision has made impressive progress in low-level tasks like head and body pose estimation, the detection of more subtle behaviors such as gesturing, grooming, or fumbling is not well explored. In this paper we present BBSI, the first set of annotations of complex Bodily Behaviors embedded in continuous Social Interactions in a group setting. Based on previous work in psychology, we manually annotated 26 hours of spontaneous human behavior in the MPIIGroupInteraction dataset with 15 distinct body language classes. We present comprehensive descriptive statistics on the resulting dataset as well as results of annotation quality evaluations. For automatic detection of these behaviors, we adapt the Pyramid Dilated Attention Network (PDAN), a state-of-the-art approach for human action detection. We perform experiments using four variants of spatial-temporal features as input to PDAN: Two-Stream Inflated 3D CNN, Temporal Segment Networks, Temporal Shift Module and Swin Transformer. Results are promising and indicate a great room for improvement in this difficult task. Representing a key piece in the puzzle towards automatic understanding of social behavior, BBSI is fully available to the research community.
updated: Wed Dec 07 2022 22:02:35 GMT+0000 (UTC)
published: Tue Jul 26 2022 11:24:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト