arXiv reaDer
See More Than Once -- Kernel-Sharing Atrous Convolution for Semantic Segmentation
  最先端のセマンティックセグメンテーションソリューションは、通常、複数の並列ブランチを介してさまざまな受容フィールドを活用して、さまざまなサイズのオブジェクトを処理します。ただし、個々のブランチに個別のカーネルを使用すると、ネットワークの一般化および表現能力が低下し、ブランチの数の倍数だけパラメーターの量が増加します。この問題に取り組むために、異なるネットワークの構造が提案されています。すなわち、異なる受容フィールドのブランチが同じカーネルを共有するカーネル共有Atrous Convolution(KSAC)です。ブランチ間の通信を容易にし、ネットワーク内で「機能拡張」を実行するための受容フィールド。ベンチマークVOC 2012データセットで実施された実験は、提案された共有戦略がネットワークの一般化および表現能力を高めるだけでなく、モデルの複雑さを大幅に削減できることを示しています。具体的には、MobileNetv2バックボーンを装備したDeepLabV3 +と比較すると、パラメーターが33%削減され、mIOUが0.6%改善されています。 Xceptionをバックボーンとして使用すると、mIOUは83.34%から85.96%に上昇し、約10Mのパラメーターが保存されます。さらに、広く使用されているASPP構造とは異なり、提案されているKSACは、より大きな心拍数でより広いコンテキストを活用することで、mIOUをさらに改善することができます。
The state-of-the-art semantic segmentation solutions usually leverage different receptive fields via multiple parallel branches to handle objects with different sizes. However, employing separate kernels for individual branches degrades the generalization and representation abilities of the network, and the amount of parameters increases by the times of the number of branches. To tackle this problem, we propose a novel network structure namely Kernel-Sharing Atrous Convolution (KSAC), where branches of different receptive fields share the same kernel, i.e., let a single kernel `see' the input feature maps more than once with different receptive fields, to facilitate communication among branches and perform `feature augmentation' inside the network. Experiments conducted on the benchmark VOC 2012 dataset show that the proposed sharing strategy can not only boost network's generalization and representation abilities but also reduce the model complexity significantly. Specifically, when compared with DeepLabV3+ equipped with MobileNetv2 backbone, 33% parameters are reduced together with an mIOU improvement of 0.6%. When Xception is used as the backbone, the mIOU is elevated from 83.34% to 85.96% with about 10M parameters saved. In addition, different from the widely used ASPP structure, our proposed KSAC is able to further improve the mIOU by taking benefit of wider context with larger atrous rates.
updated: Mon Aug 26 2019 03:01:38 GMT+0000 (UTC)
published: Mon Aug 26 2019 03:01:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト