arXiv reaDer
自動運転におけるセマンティックセグメンテーションのためのクロスデータセット共学習
Cross-Dataset Collaborative Learning for Semantic Segmentation in Autonomous Driving
セマンティックセグメンテーションは、自動運転車やロボット工学のシーンを理解するための重要なタスクです。これは、画像内のすべてのピクセルに高密度のラベルを割り当てることを目的としています。既存の作業は通常、ターゲットデータセットのさまざまなネットワークアーキテクチャを調査することにより、セマンティックセグメンテーションのパフォーマンスを向上させます。異なるデータセット間での固有の分布シフトのため、複数のデータセットから同時に学習することによって統一されたシステムを構築することにほとんど注意が払われていません。この論文では、クロスデータセット共学習(CDCL)と呼ばれる、セマンティックセグメンテーションのためのシンプルで柔軟かつ一般的な方法を提案します。私たちの目標は、すべてのデータセットからの情報を活用して、各データセットのパフォーマンスを向上させるための統合モデルをトレーニングすることです。具体的には、最初に、ネットワークの基本的なコンピューティングユニットとしてデータセット対応ブロック(DAB)のファミリーを紹介します。これは、さまざまなデータセットにわたる同種の畳み込み表現と異種の統計をキャプチャするのに役立ちます。次に、協調的最適化手順を容易にするためのデータセット代替トレーニング(DAT)メカニズムを紹介します。自動運転のための多様なセマンティックセグメンテーションデータセットについて、広範な評価を実施しています。実験は、私たちの方法が、余分なFLOPを導入することなく、以前の単一データセットおよびクロスデータセットのトレーニング方法に比べて一貫して顕著な改善を達成することを示しています。特に、PSPNet(ResNet-18)の同じアーキテクチャでは、私たちの方法は、Cityscapes、BDD100K、CamVidの検証セットでそれぞれ5.65%、6.57%、5.79%mIoUだけ単一データセットベースラインを上回っています。また、点群3DセマンティックセグメンテーションにCDCLを適用し、パフォーマンスの向上を実現します。これにより、メソッドの優位性と一般性がさらに検証されます。コードとモデルがリリースされます。
Semantic segmentation is an important task for scene understanding in self-driving cars and robotics, which aims to assign dense labels for all pixels in the image. Existing work typically improves semantic segmentation performance by exploring different network architectures on a target dataset. Little attention has been paid to build a unified system by simultaneously learning from multiple datasets due to the inherent distribution shift across different datasets. In this paper, we propose a simple, flexible, and general method for semantic segmentation, termed Cross-Dataset Collaborative Learning (CDCL). Our goal is to train a unified model for improving the performance in each dataset by leveraging information from all the datasets. Specifically, we first introduce a family of Dataset-Aware Blocks (DAB) as the fundamental computing units of the network, which help capture homogeneous convolutional representations and heterogeneous statistics across different datasets. Second, we present a Dataset Alternation Training (DAT) mechanism to facilitate the collaborative optimization procedure. We conduct extensive evaluations on diverse semantic segmentation datasets for autonomous driving. Experiments demonstrate that our method consistently achieves notable improvements over prior single-dataset and cross-dataset training methods without introducing extra FLOPs. Particularly, with the same architecture of PSPNet (ResNet-18), our method outperforms the single-dataset baseline by 5.65%, 6.57%, and 5.79% mIoU on the validation sets of Cityscapes, BDD100K, CamVid, respectively. We also apply CDCL for point cloud 3D semantic segmentation and achieve improved performance, which further validates the superiority and generality of our method. Code and models will be released.
updated: Tue Nov 02 2021 01:55:40 GMT+0000 (UTC)
published: Sun Mar 21 2021 09:59:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト