arXiv reaDer
危険な環境での協力的な脱出計画のために映画から危険を評価することを学ぶ
Learning to Assess Danger from Movies for Cooperative Escape Planning in Hazardous Environments
ロボットの知覚とナビゲーションを改善するための多くの作業がありましたが、火災や地震などの危険な環境でのそれらのアプリケーションはまだ初期段階にあります。ここでは、2つの重要な課題を仮定します。1つは、トレーニングとテストの目的で必要な、このようなシナリオを現実の世界で再現することは困難です。第二に、現在のシステムは、そのような危険な環境で利用可能な豊富なマルチモーダルデータを十分に活用することができません。最初の課題に対処するために、映画やテレビ番組の形で利用できる膨大な量のビジュアルコンテンツを活用し、現実の世界で遭遇する危険な環境を表すことができるデータセットを開発することを提案します。データには、現実的な災害画像の高レベルの危険度評価が注釈として付けられ、シーンのコンテンツを要約する対応するキーワードが提供されます。 2番目の課題に応えて、協調的な人間とロボットの脱出シナリオのためのマルチモーダル危険推定パイプラインを提案します。私たちのベイジアンフレームワークは、ロボットのカメラセンサーからの情報と人間からの言語入力を融合することにより、危険推定を改善します。さらに、危険な環境からのより安全な経路を特定するのに役立つリスク認識プランナーを使用して、推定モジュールを強化します。広範なシミュレーションを通じて、マルチモーダル知覚フレームワークの利点を示します。これは、人間とロボットの共同ミッションでの成功率の向上など、具体的なメリットに変換されます。
There has been a plethora of work towards improving robot perception and navigation, yet their application in hazardous environments, like during a fire or an earthquake, is still at a nascent stage. We hypothesize two key challenges here: first, it is difficult to replicate such scenarios in the real world, which is necessary for training and testing purposes. Second, current systems are not fully able to take advantage of the rich multi-modal data available in such hazardous environments. To address the first challenge, we propose to harness the enormous amount of visual content available in the form of movies and TV shows, and develop a dataset that can represent hazardous environments encountered in the real world. The data is annotated with high-level danger ratings for realistic disaster images, and corresponding keywords are provided that summarize the content of the scene. In response to the second challenge, we propose a multi-modal danger estimation pipeline for collaborative human-robot escape scenarios. Our Bayesian framework improves danger estimation by fusing information from robot's camera sensor and language inputs from the human. Furthermore, we augment the estimation module with a risk-aware planner that helps in identifying safer paths out of the dangerous environment. Through extensive simulations, we exhibit the advantages of our multi-modal perception framework that gets translated into tangible benefits such as higher success rate in a collaborative human-robot mission.
updated: Wed Jul 27 2022 21:07:15 GMT+0000 (UTC)
published: Wed Jul 27 2022 21:07:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト