arXiv reaDer
リアルタイムのフォアグラウンドセグメンテーションのためのデレインセマンティックセグメンテーションネットワーク
A De-raining semantic segmentation network for real-time foreground segmentation
雨の環境でのリアルタイムのセマンティックセグメンテーションのために特別に提案された研究はほとんどありません。ただし、この分野での需要は膨大であり、軽量ネットワークにとっては困難です。したがって、この論文では、雨の多い環境での前景セグメンテーション用に特別に設計された、De-raining Semantic Segmentation Network(DRSNet)と呼ばれる軽量ネットワークを提案します。 MultiScaleSEブロックは、雨滴の特性を分析することにより、入力画像をエンコードするようにターゲットを絞って設計され、受容野を増やすためにマルチスケールの拡張畳み込みを使用し、各チャネルの重みを学習するためにSE注意メカニズムを使用します。異なるエンコーダー層とデコーダー層の間でセマンティック情報を組み合わせるために、非対称スキップを使用することが提案されています。つまり、エンコーダーの上位セマンティックレイヤーは双一次補間を採用し、出力は点ごとの畳み込みを通過してから、下位セマンティックに要素ごとに追加されます。デコーダーのレイヤー。対照実験によると、SEResNet18および対称スキップと比較したMultiScaleSEブロックおよび非対称スキップのパフォーマンスは、フォアグラウンド精度インデックスである程度改善されています。 DRSNetのパラメーターと浮動小数点演算(FLOP)は、それぞれ0.54Mと0.20GFLOPのみです。最先端の結果とリアルタイムのパフォーマンスは、UESTCの終日シーナリー追加雨(UAS-add-rain)とBaidu People Segmentation追加雨(BPS-add-rain)ベンチマークの両方で達成されます。 192 * 128、384 * 256、および768 * 512の入力サイズ。 DRSNetの速度は、1GFLOP内のすべてのネットワークを上回り、フォアグラウンド精度インデックスも、両方のベンチマークで同様の規模のネットワークの中で最高です。
Few researches have been proposed specifically for real-time semantic segmentation in rainy environments. However, the demand in this area is huge and it is challenging for lightweight networks. Therefore, this paper proposes a lightweight network which is specially designed for the foreground segmentation in rainy environments, named De-raining Semantic Segmentation Network (DRSNet). By analyzing the characteristics of raindrops, the MultiScaleSE Block is targetedly designed to encode the input image, it uses multi-scale dilated convolutions to increase the receptive field, and SE attention mechanism to learn the weights of each channels. In order to combine semantic information between different encoder and decoder layers, it is proposed to use Asymmetric Skip, that is, the higher semantic layer of encoder employs bilinear interpolation and the output passes through pointwise convolution, then added element-wise to the lower semantic layer of decoder. According to the control experiments, the performances of MultiScaleSE Block and Asymmetric Skip compared with SEResNet18 and Symmetric Skip respectively are improved to a certain degree on the Foreground Accuracy index. The parameters and the floating point of operations (FLOPs) of DRSNet is only 0.54M and 0.20GFLOPs separately. The state-of-the-art results and real-time performances are achieved on both the UESTC all-day Scenery add rain (UAS-add-rain) and the Baidu People Segmentation add rain (BPS-add-rain) benchmarks with the input sizes of 192*128, 384*256 and 768*512. The speed of DRSNet exceeds all the networks within 1GFLOPs, and Foreground Accuracy index is also the best among the similar magnitude networks on both benchmarks.
updated: Fri Apr 16 2021 04:09:13 GMT+0000 (UTC)
published: Fri Apr 16 2021 04:09:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト