SLAMシステムの機能を向上させ、オブジェクトレベルの表現を作成するために、コミュニティは、推定プロセスへの高レベルの優先順位の賦課をますます調査しています。そのような例の1つは、オブジェクト検出器を使用して完全なCADモデルをロードおよび登録することです。私たちの仕事は、このアイデアを未知のオブジェクトのある環境に拡張し、最新のクラス固有のニューラルネットワークを採用して完全なモデルジオメトリ提案を生成することにより、オブジェクトの優先順位を課しています。実際のSLAMシナリオでこのような予測を使用することの難しさは、予測パフォーマンスが視点と測定品質に依存することであり、入力データのわずかな変更でさえネットワーク出力に大きな変動をもたらすことがあります。オンライン深度測定との合意を再実施することにより、異なる登録ビューからの複数の提案の中から最適なものを見つける離散選択戦略を提案します。その結果、セマンティックアノテーションを使用して、コンパクトで、忠実度が高く、密度の高い3Dマップを生成する、効果的なオブジェクトレベルのRGBD SLAMシステムが得られます。これは、マップの完全性と測定品質の低下に対する回復力の点で、従来の融合戦略よりも優れています。
In an effort to increase the capabilities of SLAM systems and produce object-level representations, the community increasingly investigates the imposition of higher-level priors into the estimation process. One such example is given by employing object detectors to load and register full CAD models. Our work extends this idea to environments with unknown objects and imposes object priors by employing modern class-specific neural networks to generate complete model geometry proposals. The difficulty of using such predictions in a real SLAM scenario is that the prediction performance depends on the view-point and measurement quality, with even small changes of the input data sometimes leading to a large variability in the network output. We propose a discrete selection strategy that finds the best among multiple proposals from different registered views by re-enforcing the agreement with the online depth measurements. The result is an effective object-level RGBD SLAM system that produces compact, high-fidelity, and dense 3D maps with semantic annotations. It outperforms traditional fusion strategies in terms of map completeness and resilience against degrading measurement quality.