セマンティックセグメンテーションは、ロボット関連のアプリケーション、特に自動運転にメリットをもたらします。セマンティックセグメンテーションに関する研究のほとんどは、セグメンテーションモデルの精度を上げることに関するものであり、計算効率の高いソリューションにはほとんど注意を払っていません。この方向で行われたいくつかの作業は、セグメンテーションのための異なる設計の選択を評価するための原理的な方法を提供していません。このホワイトペーパーでは、特徴の抽出と復号化の方法を分離した設計で、リアルタイムのセマンティックセグメンテーションベンチマークフレームワークを提示することで、このギャップに対処します。フレームワークは、VGG16、Resnet18、MobileNet、ShuffleNetなどの特徴抽出用のさまざまなネットワークアーキテクチャで構成されています。また、デコード方法を定義するセグメンテーション用の複数のメタアーキテクチャで構成されています。これらには、SkipNet、UNet、およびDilationフロントエンドが含まれます。実験結果は、都市シーンのCityscapesデータセットに表示されます。モジュラー設計により、SegNetと比較して143倍のGFLOPの削減につながる新しいアーキテクチャーが出現します。このベンチマークフレームワークは、「https://github.com/MSiam/TFSegmentation」で公開されています。
Semantic segmentation benefits robotics related applications especially autonomous driving. Most of the research on semantic segmentation is only on increasing the accuracy of segmentation models with little attention to computationally efficient solutions. The few work conducted in this direction does not provide principled methods to evaluate the different design choices for segmentation. In this paper, we address this gap by presenting a real-time semantic segmentation benchmarking framework with a decoupled design for feature extraction and decoding methods. The framework is comprised of different network architectures for feature extraction such as VGG16, Resnet18, MobileNet, and ShuffleNet. It is also comprised of multiple meta-architectures for segmentation that define the decoding methodology. These include SkipNet, UNet, and Dilation Frontend. Experimental results are presented on the Cityscapes dataset for urban scenes. The modular design allows novel architectures to emerge, that lead to 143x GFLOPs reduction in comparison to SegNet. This benchmarking framework is publicly available at "https://github.com/MSiam/TFSegmentation".