arXiv reaDer
単一のRGB画像からのパノプティコン3Dシーンの再構成
Panoptic 3D Scene Reconstruction From a Single RGB Image
単一の画像から3Dシーンを理解することは、ロボット工学、動作計画、拡張現実など、さまざまなタスクの基本です。単一のRGB画像からの3D知覚における既存の作品は、幾何学的再構成のみ、またはセマンティックセグメンテーションまたはインスタンスセグメンテーションを使用した幾何学的再構成に焦点を当てる傾向があります。 2Dパノラマセグメンテーションに触発されて、幾何学的再構成、3Dセマンティックセグメンテーション、および3Dインスタンスセグメンテーションのタスクをパノラマ3Dシーン再構成のタスクに統合することを提案します-単一のRGB画像から、カメラ内のシーンの完全な幾何学的再構成を予測しますセマンティックおよびインスタンスのセグメンテーションとともに、画像のフラスタム。したがって、入力画像から3Dボリュームシーン表現に2D特徴を持ち上げて伝播することを学習する、単一のRGB画像から全体的な3Dシーンを理解するための新しいアプローチを提案します。共同シーンの再構築、セマンティック、およびインスタンスのセグメンテーションのこの全体的なビューは、タスクを独立して処理するよりも有益であり、したがって代替アプローチよりも優れていることを示します。
Understanding 3D scenes from a single image is fundamental to a wide variety of tasks, such as for robotics, motion planning, or augmented reality. Existing works in 3D perception from a single RGB image tend to focus on geometric reconstruction only, or geometric reconstruction with semantic segmentation or instance segmentation. Inspired by 2D panoptic segmentation, we propose to unify the tasks of geometric reconstruction, 3D semantic segmentation, and 3D instance segmentation into the task of panoptic 3D scene reconstruction - from a single RGB image, predicting the complete geometric reconstruction of the scene in the camera frustum of the image, along with semantic and instance segmentations. We thus propose a new approach for holistic 3D scene understanding from a single RGB image which learns to lift and propagate 2D features from an input image to a 3D volumetric scene representation. We demonstrate that this holistic view of joint scene reconstruction, semantic, and instance segmentation is beneficial over treating the tasks independently, thus outperforming alternative approaches.
updated: Mon May 16 2022 15:51:09 GMT+0000 (UTC)
published: Wed Nov 03 2021 18:06:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト