arXiv reaDer
RGB-Dフュージョンによるスケール不変のセマンティックセグメンテーション
Scale Invariant Semantic Segmentation with RGB-D Fusion
本論文では、RGB-D画像を使用したスケール不変のセマンティックセグメンテーションのためのニューラルネットワークアーキテクチャを提案します。カラー画像のみとは別に、深度情報を追加のモダリティとして利用します。特に、カメラからのオブジェクトの距離に起因するさまざまなスケールのオブジェクトで構成される屋外シーンで。近距離オブジェクトは、遠距離オブジェクトよりもかなり多くのピクセルで構成されています。屋外シーンのさまざまなスケールオブジェクトに対応するために、ピクセル単位のセマンティックセグメンテーションのためにRGBデータに深度情報を組み込むことを提案します。 RGBベースラインとして、よく知られているDeepLab-v2(ResNet-101)モデルを採用しています。深度画像は、個別のブランチを持つ追加の入力として個別に渡されます。カラーと深度の両方の画像ブランチの中間特徴マップは、新しい融合ブロックを使用して融合されます。私たちのモデルはコンパクトで、他のRGBモデルに簡単に適用できます。やりがいのあるデータセットCityscapesに対して、広範な定性的および定量的評価を実行します。得られた結果は、最先端のものに匹敵します。さらに、自己記録された実際のデータセットでモデルを評価しました。グラウンドトゥルースを使用した運転シーンの拡張評価の揺れについて、人気のある車両シミュレーションプロジェクトCARLAを使用して合成データセットを生成しました。実際のデータセットと合成データセットから得られた結果は、私たちのアプローチの有効性を示しています。
In this paper, we propose a neural network architecture for scale-invariant semantic segmentation using RGB-D images. We utilize depth information as an additional modality apart from color images only. Especially in an outdoor scene which consists of different scale objects due to the distance of the objects from the camera. The near distance objects consist of significantly more pixels than the far ones. We propose to incorporate depth information to the RGB data for pixel-wise semantic segmentation to address the different scale objects in an outdoor scene. We adapt to a well-known DeepLab-v2(ResNet-101) model as our RGB baseline. Depth images are passed separately as an additional input with a distinct branch. The intermediate feature maps of both color and depth image branch are fused using a novel fusion block. Our model is compact and can be easily applied to the other RGB model. We perform extensive qualitative and quantitative evaluation on a challenging dataset Cityscapes. The results obtained are comparable to the state-of-the-art. Additionally, we evaluated our model on a self-recorded real dataset. For the shake of extended evaluation of a driving scene with ground truth we generated a synthetic dataset using popular vehicle simulation project CARLA. The results obtained from the real and synthetic dataset shows the effectiveness of our approach.
updated: Sun Apr 10 2022 12:54:27 GMT+0000 (UTC)
published: Sun Apr 10 2022 12:54:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト