arXiv reaDer
信頼性の高い画像アウトペインティングに向けて: 深度ガイダンスを使用した構造認識マルチモーダル フュージョンの学習
Towards Reliable Image Outpainting: Learning Structure-Aware Multimodal Fusion with Depth Guidance
画像アウトペインティング技術は、信憑性に関係なく視覚的にもっともらしいコンテンツを生成するため、実際に適用することは信頼できません.したがって、LiDAR からまばらな深度を導入して本物の RGB シーンを推定する、信頼性の高い画像アウトペインティング タスクを提案します。 LiDAR の広いフィールド ビューにより、データの強化やさらにマルチモーダルなタスクに使用できます。具体的には、深度ガイド アウトペインティング ネットワークを提案して、2 つのモダリティの異なる特徴表現をモデル化し、構造を意識したクロスモーダル融合を学習します。また、2 つのコンポーネントが設計されています。1) マルチモーダル学習モジュールは、さまざまなモーダル特性の観点から、独自の深さと RGB 機能表現を生成します。 2) 深度ガイダンス融合モジュールは、完全な深度モダリティを活用して、プログレッシブ マルチモーダル機能融合によって RGB コンテンツの確立をガイドします。さらに、あいまいな輪郭を強化し、信頼性の高いコンテンツ生成を促進するために、クロスモーダル損失とエッジ損失で構成される追加の制約戦略を特別に設計します。 KITTI と Waymo のデータセットに関する広範な実験は、定量的および定性的に最先端の方法よりも優れていることを示しています。
Image outpainting technology generates visually plausible content regardless of authenticity, making it unreliable to be applied in practice. Thus, we propose a reliable image outpainting task, introducing the sparse depth from LiDARs to extrapolate authentic RGB scenes. The large field view of LiDARs allows it to serve for data enhancement and further multimodal tasks. Concretely, we propose a Depth-Guided Outpainting Network to model different feature representations of two modalities and learn the structure-aware cross-modal fusion. And two components are designed: 1) The Multimodal Learning Module produces unique depth and RGB feature representations from the perspectives of different modal characteristics. 2) The Depth Guidance Fusion Module leverages the complete depth modality to guide the establishment of RGB contents by progressive multimodal feature fusion. Furthermore, we specially design an additional constraint strategy consisting of Cross-modal Loss and Edge Loss to enhance ambiguous contours and expedite reliable content generation. Extensive experiments on KITTI and Waymo datasets demonstrate our superiority over the state-of-the-art method, quantitatively and qualitatively.
updated: Thu Feb 16 2023 06:18:56 GMT+0000 (UTC)
published: Tue Apr 12 2022 06:06:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト