arXiv reaDer
セマンティック画像のセグメンテーションのための膨張分離可能コンボリューションを用いたエンコーダ-デコーダ
Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation
ディープニューラルネットワークでは、空間ピラミッドプーリングモジュールやエンコードデコーダ構造がセマンティックセグメンテーションタスクに用いられている。前者のネットワークは、フィルタやプーリング操作を用いて入力された特徴量を複数のレートで複数の有効視野でプロービングすることで、マルチスケールの文脈情報を符号化することができるのに対し、後者のネットワークは空間情報を徐々に回復することで、よりシャープな物体境界を捉えることができる。本研究では、両者の利点を組み合わせることを提案する。具体的には、我々が提案するモデルDeepLabv3+は、DeepLabv3を拡張し、特に物体境界に沿ったセグメンテーション結果を洗練させるために、シンプルで効果的なデコーダモジュールを追加することで、DeepLabv3を拡張する。さらに、Xceptionモデルを探索し、膨張空間ピラミッドプーリングとデコーダモジュールの両方に深さ方向に分離可能な畳み込みを適用することで、より高速で強力なエンコーダ/デコーダネットワークを実現している。提案モデルの有効性をPASCAL VOC 2012とCityscapesのデータセットで実証し、後処理なしで89.0%と82.1%のテストセット性能を達成した。本論文には、https://github.com/tensorflow/models/tree/master/research/deeplab にある Tensorflow での提案モデルの公開されているリファレンス実装が添付されている。
Spatial pyramid pooling module or encode-decoder structure are used in deep neural networks for semantic segmentation task. The former networks are able to encode multi-scale contextual information by probing the incoming features with filters or pooling operations at multiple rates and multiple effective fields-of-view, while the latter networks can capture sharper object boundaries by gradually recovering the spatial information. In this work, we propose to combine the advantages from both methods. Specifically, our proposed model, DeepLabv3+, extends DeepLabv3 by adding a simple yet effective decoder module to refine the segmentation results especially along object boundaries. We further explore the Xception model and apply the depthwise separable convolution to both Atrous Spatial Pyramid Pooling and decoder modules, resulting in a faster and stronger encoder-decoder network. We demonstrate the effectiveness of the proposed model on PASCAL VOC 2012 and Cityscapes datasets, achieving the test set performance of 89.0% and 82.1% without any post-processing. Our paper is accompanied with a publicly available reference implementation of the proposed models in Tensorflow at https://github.com/tensorflow/models/tree/master/research/deeplab.
updated: Wed Aug 22 2018 20:41:10 GMT+0000 (UTC)
published: Wed Feb 07 2018 19:37:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト