arXiv reaDer
Multipar-T: グループ会話における偶発的な行動を捉えるための Multiparty-Transformer
Multipar-T: Multiparty-Transformer for Capturing Contingent Behaviors in Group Conversations
現実世界の AI システムに近づくにつれて、AI エージェントはマルチパーティ (グループ) の会話を処理できなければなりません。システムは個々の行動の手がかりを認識し、複数の人々からの複数のデータストリームの複雑さに対処し、グループメンバー間で発生する微妙な偶発的な社会的交換を認識しなければならないため、マルチパーティの行動を認識して解釈することは困難です.この課題に取り組むために、マルチパーティ動作モデリングのトランスフォーマー モデルである Multiparty-Transformer (Multipar-T) を提案します。私たちが提案するアプローチの中核となるコンポーネントは、クロスパーソン アテンションです。これは、2 人のペアの間の偶発的な行動を検出するように特別に設計されています。公開されているビデオベースのグループ エンゲージメント検出ベンチマークで Multipar-T の有効性を検証します。このベンチマークでは、平均 F-1 スコアで 5.2%、個々のクラスの F-1 スコアで最先端のアプローチよりも優れています。 10.0%。定性分析を通じて、Crossperson Attention モジュールが偶発的な行動を発見できることを示しています。
As we move closer to real-world AI systems, AI agents must be able to deal with multiparty (group) conversations. Recognizing and interpreting multiparty behaviors is challenging, as the system must recognize individual behavioral cues, deal with the complexity of multiple streams of data from multiple people, and recognize the subtle contingent social exchanges that take place amongst group members. To tackle this challenge, we propose the Multiparty-Transformer (Multipar-T), a transformer model for multiparty behavior modeling. The core component of our proposed approach is the Crossperson Attention, which is specifically designed to detect contingent behavior between pairs of people. We verify the effectiveness of Multipar-T on a publicly available video-based group engagement detection benchmark, where it outperforms state-of-the-art approaches in average F-1 scores by 5.2% and individual class F-1 scores by up to 10.0%. Through qualitative analysis, we show that our Crossperson Attention module is able to discover contingent behavior.
updated: Wed Apr 19 2023 20:23:11 GMT+0000 (UTC)
published: Wed Apr 19 2023 20:23:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト