シーン内を移動する複数のオブジェクトを同時に追跡および再構築する機能は、自律ナビゲーションやインタラクションなどのロボットタスクにとって最も重要です。複数の動的オブジェクトをマッピングするこれまでのほとんどすべての試みは、個々のオブジェクトを別々の再構成ボリュームに格納し、それらの間の相対的なポーズを追跡するように進化しました。シンプルで直感的ですが、このような定式化はシーン内のオブジェクトの数に関して適切にスケーリングされず、明示的なオクルージョン処理戦略の必要性をもたらします。対照的に、シーン全体とその中のすべてのオブジェクトに対して単一のボリュームを維持できるマップ表現を提案します。この目的のために、マップ内の任意の場所で複数のオブジェクトサーフェスをエンコードできる新しいマルチオブジェクトTSDF定式化を紹介します。複数の動的オブジェクト追跡および再構成シナリオでは、私たちの表現により、近くを移動する他のオブジェクトによって一時的に遮られた場合でも、サーフェスの正確な再構成を維持できます。公開された合成データセットで提案されたTSDF ++の定式化を評価し、標準のTSDFマップ表現と比較した場合に遮蔽された表面の再構成を保持する能力を示します。
The ability to simultaneously track and reconstruct multiple objects moving in the scene is of the utmost importance for robotic tasks such as autonomous navigation and interaction. Virtually all of the previous attempts to map multiple dynamic objects have evolved to store individual objects in separate reconstruction volumes and track the relative pose between them. While simple and intuitive, such formulation does not scale well with respect to the number of objects in the scene and introduces the need for an explicit occlusion handling strategy. In contrast, we propose a map representation that allows maintaining a single volume for the entire scene and all the objects therein. To this end, we introduce a novel multi-object TSDF formulation that can encode multiple object surfaces at any given location in the map. In a multiple dynamic object tracking and reconstruction scenario, our representation allows maintaining accurate reconstruction of surfaces even while they become temporarily occluded by other objects moving in their proximity. We evaluate the proposed TSDF++ formulation on a public synthetic dataset and demonstrate its ability to preserve reconstructions of occluded surfaces when compared to the standard TSDF map representation.