arXiv reaDer
EdgeNet:単一のRGB-D画像からのセマンティックシーンの完成
EdgeNet: Semantic Scene Completion from a Single RGB-D Image
セマンティックシーンの完成は、単一の視点からのシーンの対応するセマンティックラベルを使用して、体積占有率の完全な3D表現を予測するタスクです。以前は、2D画像を3Dボリュームに投影してスパースデータ表現を生成することにより、深さのみまたは色付きの深さのいずれかを使用したRGB-Dデータからのセマンティックシーン補完に関する作業を行いました。この作業では、エッジ検出と切り捨てられた符号付き距離を使用して、3D空間で色情報をエンコードする新しい戦略を紹介します。また、深度情報とエッジ情報の融合から生成された機能を処理できる新しいエンドツーエンドのニューラルネットワークアーキテクチャであるEdgeNetも紹介します。実験結果では、エンドツーエンドのアプローチで、実際のデータに関する最新の結果よりも6.9%改善されています。
Semantic scene completion is the task of predicting a complete 3D representation of volumetric occupancy with corresponding semantic labels for a scene from a single point of view. Previous works on Semantic Scene Completion from RGB-D data used either only depth or depth with colour by projecting the 2D image into the 3D volume resulting in a sparse data representation. In this work, we present a new strategy to encode colour information in 3D space using edge detection and flipped truncated signed distance. We also present EdgeNet, a new end-to-end neural network architecture capable of handling features generated from the fusion of depth and edge information. Experimental results show improvement of 6.9% over the state-of-the-art result on real data, for end-to-end approaches.
updated: Sun Sep 06 2020 20:17:18 GMT+0000 (UTC)
published: Thu Aug 08 2019 01:00:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト