arXiv reaDer
CFPNet:リアルタイムセマンティックセグメンテーションのためのチャネルごとの特徴ピラミッド
CFPNet: Channel-wise Feature Pyramid for Real-Time Semantic Segmentation
リアルタイムのセマンティックセグメンテーションは、モバイルデバイスと自動運転の需要が高まっているため、コンピュータービジョンでより重要な役割を果たしています。したがって、パフォーマンス、モデルサイズ、および推論速度の間で適切なトレードオフを実現することが非常に重要です。この論文では、これらの要素のバランスをとるために、チャネルごとの特徴ピラミッド(CFP)モジュールを提案します。 CFPモジュールに基づいて、リアルタイムのセマンティックセグメンテーション用のCFPNetを構築しました。これは、一連の拡張された畳み込みチャネルを適用して、効果的な特徴を抽出します。都市の景観とCamVidデータセットに関する実験は、提案されたCFPNetがこれらの要素の効果的な組み合わせを実現することを示しています。 Cityscapesテストデータセットの場合、CFPNetはわずか55万のパラメーターと2.5 MBのメモリで70.1%のクラスごとのmIoUを達成します。推論速度は、1024x2048ピクセルの画像を備えた単一のRTX 2080TiGPUで30FPSに達する可能性があります。
Real-time semantic segmentation is playing a more important role in computer vision, due to the growing demand for mobile devices and autonomous driving. Therefore, it is very important to achieve a good trade-off among performance, model size and inference speed. In this paper, we propose a Channel-wise Feature Pyramid (CFP) module to balance those factors. Based on the CFP module, we built CFPNet for real-time semantic segmentation which applied a series of dilated convolution channels to extract effective features. Experiments on Cityscapes and CamVid datasets show that the proposed CFPNet achieves an effective combination of those factors. For the Cityscapes test dataset, CFPNet achieves 70.1% class-wise mIoU with only 0.55 million parameters and 2.5 MB memory. The inference speed can reach 30 FPS on a single RTX 2080Ti GPU with a 1024x2048-pixel image.
updated: Wed Jun 02 2021 19:45:09 GMT+0000 (UTC)
published: Mon Mar 22 2021 22:39:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト