arXiv reaDer
Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of Demonstrations for Social Navigation
ソーシャルナビゲーションは、ロボットなどの自律エージェントが、人間などの他のインテリジェントエージェントの存在下で「社会的に準拠した」方法でナビゲートする機能です。人間が住む環境で自律的にナビゲートする移動ロボット(たとえば、家庭やレストランの家庭用サービスロボット、公共の歩道の食品配送ロボット)の出現により、これらのロボットに社会的に準拠したナビゲーション動作を組み込むことは、安全で快適な人間のロボットの共存を確保するために重要になります。この課題に対処するために、模倣学習は有望なフレームワークです。これは、ソーシャルナビゲーションの複雑な多目的設定を正確にキャプチャする報酬関数を作成するよりも、人間がソーシャルナビゲーションのタスクを示す方が簡単だからです。ただし、移動ロボットのソーシャルナビゲーションへの模倣学習と逆強化学習の使用は、現在、社会的に準拠したロボットナビゲーションのデモンストレーションを実際にキャプチャする大規模なデータセットの欠如によって妨げられています。このギャップを埋めるために、Socially CompliAnt Navigation Dataset(SCAND)を導入し、社会的に準拠したナビゲーションデモンストレーションの大規模な一人称ビューデータセットを紹介します。私たちのデータセットには、8.7時間、138の軌跡、25マイルの社会的に準拠した、人間のテレオペレーションによる運転のデモンストレーションが含まれています。屋内と屋外の両方の環境での4人の異なる人間のデモンストレーターによるClearpathJackal。さらに、実際のロボット実験を通じて予備的な分析と検証を実行し、SCANDでの模倣学習によって学習されたナビゲーションポリシーが社会的に準拠した動作を生成することを示します
Social navigation is the capability of an autonomous agent, such as a robot, to navigate in a 'socially compliant' manner in the presence of other intelligent agents such as humans. With the emergence of autonomously navigating mobile robots in human populated environments (e.g., domestic service robots in homes and restaurants and food delivery robots on public sidewalks), incorporating socially compliant navigation behaviors on these robots becomes critical to ensuring safe and comfortable human robot coexistence. To address this challenge, imitation learning is a promising framework, since it is easier for humans to demonstrate the task of social navigation rather than to formulate reward functions that accurately capture the complex multi objective setting of social navigation. The use of imitation learning and inverse reinforcement learning to social navigation for mobile robots, however, is currently hindered by a lack of large scale datasets that capture socially compliant robot navigation demonstrations in the wild. To fill this gap, we introduce Socially CompliAnt Navigation Dataset (SCAND) a large scale, first person view dataset of socially compliant navigation demonstrations. Our dataset contains 8.7 hours, 138 trajectories, 25 miles of socially compliant, human teleoperated driving demonstrations that comprises multi modal data streams including 3D lidar, joystick commands, odometry, visual and inertial information, collected on two morphologically different mobile robots a Boston Dynamics Spot and a Clearpath Jackal by four different human demonstrators in both indoor and outdoor environments. We additionally perform preliminary analysis and validation through real world robot experiments and show that navigation policies learned by imitation learning on SCAND generate socially compliant behaviors
updated: Mon Mar 28 2022 19:09:11 GMT+0000 (UTC)
published: Mon Mar 28 2022 19:09:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト