arXiv reaDer
HoHoNet:潜在的な水平特徴を備えた360屋内ホリスティック理解
HoHoNet: 360 Indoor Holistic Understanding with Latent Horizontal Features
HoHoNetは、潜在水平特徴(LHFeat)を使用して屋内360度パノラマを全体的に理解するための多用途で効率的なフレームワークです。コンパクトなLHFeatは、垂直方向に沿ってフィーチャを平坦化し、部屋のレイアウトを再構築するための列ごとのモダリティのモデリングに成功しました。 HoHoNetは2つの重要な側面で進歩しています。まず、ディープアーキテクチャが再設計され、精度が向上して高速に実行されます。次に、列ごとの出力形状の制約を緩和し、LHFeatからのピクセルごとの密な予測を可能にする、新しい地平線から密集へのモジュールを提案します。 HoHoNetは高速です。高解像度の512×1024パノラマから高密度モダリティをモデル化するために、ResNet-50およびResNet-34バックボーンでそれぞれ52FPSおよび110FPSで実行されます。 HoHoNetも正確です。レイアウト推定とセマンティックセグメンテーションのタスクに関して、HoHoNetは現在の最先端技術と同等の結果を達成します。密な深度推定では、HoHoNetはすべての先行技術を大幅に上回っています。
We present HoHoNet, a versatile and efficient framework for holistic understanding of an indoor 360-degree panorama using a Latent Horizontal Feature (LHFeat). The compact LHFeat flattens the features along the vertical direction and has shown success in modeling per-column modality for room layout reconstruction. HoHoNet advances in two important aspects. First, the deep architecture is redesigned to run faster with improved accuracy. Second, we propose a novel horizon-to-dense module, which relaxes the per-column output shape constraint, allowing per-pixel dense prediction from LHFeat. HoHoNet is fast: It runs at 52 FPS and 110 FPS with ResNet-50 and ResNet-34 backbones respectively, for modeling dense modalities from a high-resolution 512 ×1024 panorama. HoHoNet is also accurate. On the tasks of layout estimation and semantic segmentation, HoHoNet achieves results on par with current state-of-the-art. On dense depth estimation, HoHoNet outperforms all the prior arts by a large margin.
updated: Thu Sep 09 2021 10:31:59 GMT+0000 (UTC)
published: Mon Nov 23 2020 15:59:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト