arXiv reaDer
車両統合による未来の都市シーンの生成
Future Urban Scenes Generation Through Vehicles Synthesis
この作業では、アーバンシーンの視覚的な将来の外観を予測するためのディープラーニングパイプラインを提案します。最近の進歩にもかかわらず、エンドツーエンドの方法でシーン全体を生成することはまだ達成されていません。代わりに、ここでは2段階のアプローチに従います。ここでは、解釈可能な情報がループに含まれ、各アクターが独立してモデル化されます。オブジェクトごとの新規ビュー合成パラダイムを利用します。つまり、3D空間で幾何学的な回転変換を受けているオブジェクトの合成表現を生成します。私たちのモデルは、最先端の追跡方法またはユーザー自身によって提供される制約(入力軌跡など)で簡単に条件付けできます。これにより、マルチモーダルな方法で同じ入力から始まる一連の多様な現実的な未来を生成できます。挑戦的な現実世界のデータセットであるCityFlowでの従来のエンドツーエンドのシーン生成方法に対するこのアプローチの優位性を視覚的および定量的に示します。
In this work we propose a deep learning pipeline to predict the visual future appearance of an urban scene. Despite recent advances, generating the entire scene in an end-to-end fashion is still far from being achieved. Instead, here we follow a two stages approach, where interpretable information is included in the loop and each actor is modelled independently. We leverage a per-object novel view synthesis paradigm; i.e. generating a synthetic representation of an object undergoing a geometrical roto-translation in the 3D space. Our model can be easily conditioned with constraints (e.g. input trajectories) provided by state-of-the-art tracking methods or by the user itself. This allows us to generate a set of diverse realistic futures starting from the same input in a multi-modal fashion. We visually and quantitatively show the superiority of this approach over traditional end-to-end scene-generation methods on CityFlow, a challenging real world dataset.
updated: Fri Oct 22 2021 07:54:00 GMT+0000 (UTC)
published: Wed Jul 01 2020 08:40:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト