arXiv reaDer
360-DFPE:直接フロアプラン推定のための単眼360レイアウトの活用
360-DFPE: Leveraging Monocular 360-Layouts for Direct Floor Plan Estimation
アクティブなセンサーや3D情報に依存せずに、入力として360度の画像を直接取得するシーケンシャルフロアプラン推定方法である360-DFPEを紹介します。私たちのアプローチは、単眼のビジュアルSLAMソリューションと単眼の360室レイアウトアプローチの間の緩く結合された統合を活用します。これらのアプローチは、それぞれカメラのポーズとレイアウトジオメトリを推定します。私たちの仕事は単眼画像を使用して間取り図を順次キャプチャすることであるため、シーン全体の構造、部屋のインスタンス、および部屋の形状は不明です。これらの課題に取り組むために、まず、エントロピー最小化プロセスを定式化することにより、視覚オドメトリとレイアウトジオメトリのスケールの違いを処理します。これにより、シーン全体を事前に知ることなく、360レイアウトを直接整列させることができます。次に、個々の部屋を順番に識別するために、ジオメトリ情報を使用してカメラ探索に沿ってすべての部屋を追跡する新しい部屋識別アルゴリズムを提案します。最後に、部屋の最終的な形状を推定するために、粗いものから細かいものへの反復戦略を使用した最短経路アルゴリズムを提案します。これにより、以前の定式化がより正確に、より高速に実行されます。さらに、挑戦的な大規模なシーンを含む新しいフロアプランデータセットを収集し、点群と連続する360度画像情報の両方を提供します。実験結果は、私たちの単眼ソリューションが、アクティブセンサーに依存し、シーン全体の再構成データを事前に必要とする現在の最先端のアルゴリズムに対して良好なパフォーマンスを達成することを示しています。
We present 360-DFPE, a sequential floor plan estimation method that directly takes 360-images as input without relying on active sensors or 3D information. Our approach leverages a loosely coupled integration between a monocular visual SLAM solution and a monocular 360-room layout approach, which estimate camera poses and layout geometries, respectively. Since our task is to sequentially capture the floor plan using monocular images, the entire scene structure, room instances, and room shapes are unknown. To tackle these challenges, we first handle the scale difference between visual odometry and layout geometry via formulating an entropy minimization process, which enables us to directly align 360-layouts without knowing the entire scene in advance. Second, to sequentially identify individual rooms, we propose a novel room identification algorithm that tracks every room along the camera exploration using geometry information. Lastly, to estimate the final shape of the room, we propose a shortest path algorithm with an iterative coarse-to-fine strategy, which improves prior formulations with higher accuracy and faster run-time. Moreover, we collect a new floor plan dataset with challenging large-scale scenes, providing both point clouds and sequential 360-image information. Experimental results show that our monocular solution achieves favorable performance against the current state-of-the-art algorithms that rely on active sensors and require the entire scene reconstruction data in advance.
updated: Sun May 08 2022 15:51:31 GMT+0000 (UTC)
published: Sun Dec 12 2021 08:36:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト