arXiv reaDer
一般化された 3D マルチオブジェクト検索システム
A System for Generalized 3D Multi-Object Search
物を探すことは、ロボットの基本的なスキルです。そのため、オブジェクト検索は、オブジェクト検出や SLAM などと同様に、最終的にロボットの既製の機能になると予想されます。ただし、対照的に、実際のロボットや環境全体に一般化された 3D オブジェクト検索のシステムは存在しません。この論文では、3D の信念を表現するためにオクトリー構造を利用した最近の理論的フレームワークに基づいて、3D 領域でのマルチオブジェクト検索 (MOS) のための最初の汎用システムである GenMOS (Generalized Multi-Object Search) を紹介します。つまり、ロボットに依存せず、環境に依存しません。 GenMOS は、局所領域の点群観測、物体検出結果、およびロボットのビュー ポーズのローカリゼーションを入力として受け取り、オンライン プランニングを通じて移動する 6D 視点を出力します。特に、GenMOS は次の 3 つの方法で点群観測を使用します。(1) オクルージョンをシミュレートするため。 (2) 占有率を通知し、octree の信念を初期化します。 (3)障害物を回避するビュー位置の信念依存グラフをサンプリングする。シミュレーションと 2 つの実際のロボット プラットフォームの両方でシステムを評価します。たとえば、Boston Dynamics の Spot ロボットは、ソファの下に隠れているおもちゃの猫を 1 分以内に見つけることができます。さらに、3D ローカル検索を 2D グローバル検索と統合して、より広い領域を処理し、結果として得られるシステムを 25m^2 のロビー エリアで実証します。
Searching for objects is a fundamental skill for robots. As such, we expect object search to eventually become an off-the-shelf capability for robots, similar to e.g., object detection and SLAM. In contrast, however, no system for 3D object search exists that generalizes across real robots and environments. In this paper, building upon a recent theoretical framework that exploited the octree structure for representing belief in 3D, we present GenMOS (Generalized Multi-Object Search), the first general-purpose system for multi-object search (MOS) in a 3D region that is robot-independent and environment-agnostic. GenMOS takes as input point cloud observations of the local region, object detection results, and localization of the robot's view pose, and outputs a 6D viewpoint to move to through online planning. In particular, GenMOS uses point cloud observations in three ways: (1) to simulate occlusion; (2) to inform occupancy and initialize octree belief; and (3) to sample a belief-dependent graph of view positions that avoid obstacles. We evaluate our system both in simulation and on two real robot platforms. Our system enables, for example, a Boston Dynamics Spot robot to find a toy cat hidden underneath a couch in under one minute. We further integrate 3D local search with 2D global search to handle larger areas, demonstrating the resulting system in a 25m^2 lobby area.
updated: Mon Mar 06 2023 14:47:38 GMT+0000 (UTC)
published: Mon Mar 06 2023 14:47:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト