Efficient Dense Modules of Asymmetric Convolution for Real-Time Semantic Segmentation
 リアルタイムのセマンティックセグメンテーションは、自動運転やロボットなどの実用的なアプリケーションで重要な役割を果たします。セマンティックセグメンテーションの研究のほとんどは、効率をほとんど考慮せずに推定精度を向上させることに焦点を当てています。高速推論を強調するいくつかの以前の研究では、高精度のセグメンテーション結果が得られないことがよくあります。本論文では、非対称畳み込み構造を採用し、拡張畳み込みと密な接続性を組み込んで、低計算コストとモデルサイズで高効率を実現する、非対称畳み込みを備えた効率的な高密度モジュール(EDANet)という名前の新しい畳み込みネットワークを提案します。 EDANetは、既存の高速セグメンテーションネットワークICNetの2.7倍の高速性を備えていますが、追加のコンテキストモジュール、後処理スキーム、事前トレーニングモデルなしで同様のmIoUスコアを達成しています。 CityscapesおよびCamVidデータセットでEDANetを評価し、他の最新システムと比較します。ネットワークは、1つのGTX 1080Tiで108 FPSの速度で高解像度入力を使用して実行できます。
Real-time semantic segmentation plays an important role in practical applications such as self-driving and robots. Most semantic segmentation research focuses on improving estimation accuracy with little consideration on efficiency. Several previous studies that emphasize high-speed inference often fail to produce high-accuracy segmentation results. In this paper, we propose a novel convolutional network named Efficient Dense modules with Asymmetric convolution (EDANet), which employs an asymmetric convolution structure and incorporates dilated convolution and dense connectivity to achieve high efficiency at low computational cost and model size. EDANet is 2.7 times faster than the existing fast segmentation network, ICNet, while it achieves a similar mIoU score without any additional context module, post-processing scheme, and pretrained model. We evaluate EDANet on Cityscapes and CamVid datasets, and compare it with the other state-of-art systems. Our network can run with the high-resolution inputs at the speed of 108 FPS on one GTX 1080Ti.
updated: Sat Dec 28 2019 06:11:57 GMT+0000 (UTC)
published: Mon Sep 17 2018 16:52:46 GMT+0000 (UTC)
