単一の単眼RGB画像から部屋の空間レイアウトを効率的に推定する新しい方法を提案します。低レベルの特徴抽出とそれに続く消失点推定に基づく既存のアプローチは非常に遅く、現実的なシナリオでは信頼できないことが多いため、入力画像のセマンティックセグメンテーションに基づいています。より良いセグメンテーションを取得するために、堅牢で正確かつ非常に効率的な仮説とテストのスキームを導入します。重要な考え方は、それぞれ異なる数の可視壁に基づく3つのセグメンテーション仮説を使用することです。各仮説について、部屋の角の画像位置を予測し、部屋の角から推定されたレイアウトがセグメンテーションと一致する仮説を選択します。最先端の手法を大幅に上回る3つの困難なベンチマークデータセットで、本手法の効率性と堅牢性を実証します。
We propose a novel method to efficiently estimate the spatial layout of a room from a single monocular RGB image. As existing approaches based on low-level feature extraction, followed by a vanishing point estimation are very slow and often unreliable in realistic scenarios, we build on semantic segmentation of the input image. To obtain better segmentations, we introduce a robust, accurate and very efficient hypothesize-and-test scheme. The key idea is to use three segmentation hypotheses, each based on a different number of visible walls. For each hypothesis, we predict the image locations of the room corners and select the hypothesis for which the layout estimated from the room corners is consistent with the segmentation. We demonstrate the efficiency and robustness of our method on three challenging benchmark datasets, where we significantly outperform the state-of-the-art.