arXiv reaDer
フェーズ:機械の社会的知覚のための物理的に根拠のある抽象的な社会的イベント
PHASE: PHysically-grounded Abstract Social Events for Machine Social Perception
物理的環境の文脈で社会的相互作用を認識し、推論する能力は、人間の社会的知性と人間と機械の協力の中核です。ただし、以前のデータセットやベンチマークでは、ハイタッチなどの短いアクションや、収集などの単純なグループアクティビティを超えた、複雑な社会的相互作用の物理的に根拠のある認識を体系的に評価していません。この作業では、物理的に根拠のある抽象的な社会的イベントのデータセットPHASEを作成します。これは、別のエージェントを支援するなどの社会的概念を含めることにより、実際のさまざまな社会的相互作用に似ています。 PHASEは、物理エンジンと階層プランナーを使用して手続き的に生成された連続空間を移動するエージェントのペアの2Dアニメーションで構成されます。エージェントの視野は限られており、複数のランドマークや障害物がある環境で、複数のオブジェクトと対話できます。 PHASEを使用して、社会認識タスクと社会予測タスクを設計します。 PHASEは、人間が社会的イベントで豊富な相互作用を知覚し、シミュレートされたエージェントが人間と同様に動作することを実証する人間の実験で検証されます。ベースラインモデルとして、ベイズ逆計画アプローチであるSIMPLE(SIMulation、Planning and Local Evaluation)を紹介します。これは、最先端のフィードフォワードニューラルネットワークよりも優れています。 PHASEが、複雑な社会的相互作用を認識できる新しいモデルを開発するための困難な新しい課題として役立つことを願っています。
The ability to perceive and reason about social interactions in the context of physical environments is core to human social intelligence and human-machine cooperation. However, no prior dataset or benchmark has systematically evaluated physically grounded perception of complex social interactions that go beyond short actions, such as high-fiving, or simple group activities, such as gathering. In this work, we create a dataset of physically-grounded abstract social events, PHASE, that resemble a wide range of real-life social interactions by including social concepts such as helping another agent. PHASE consists of 2D animations of pairs of agents moving in a continuous space generated procedurally using a physics engine and a hierarchical planner. Agents have a limited field of view, and can interact with multiple objects, in an environment that has multiple landmarks and obstacles. Using PHASE, we design a social recognition task and a social prediction task. PHASE is validated with human experiments demonstrating that humans perceive rich interactions in the social events, and that the simulated agents behave similarly to humans. As a baseline model, we introduce a Bayesian inverse planning approach, SIMPLE (SIMulation, Planning and Local Estimation), which outperforms state-of-the-art feed-forward neural networks. We hope that PHASE can serve as a difficult new challenge for developing new models that can recognize complex social interactions.
updated: Tue Mar 02 2021 18:44:57 GMT+0000 (UTC)
published: Tue Mar 02 2021 18:44:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト