arXiv reaDer
空間を意識した深いセマンティックセグメンテーションのための距離変換回帰
Distance transform regression for spatially-aware deep semantic segmentation
  視覚シーンの理解は、深く完全な畳み込みニューラルネットワークを介して取得された密集したピクセル単位の分類にますます依存しています。ただし、ネットワークの性質により、予測はしばしばぼやけた境界と不適切なセグメント形状に悩まされ、後処理の必要性を高めます。この作業では、距離変換の回帰に基づく新しいセマンティックセグメンテーション正則化を導入します。ラベルマスクの距離変換を計算した後、分類と距離回帰を同時に学習することにより、離散空間と連続空間の両方でマルチタスク設定でFCNをトレーニングします。これにより、ネットワーク構造をほとんど変更する必要がなく、トレーニングプロセスに非常に低いオーバーヘッドが追加されます。距離変換を近似する学習は、セグメンテーションを暗黙的に正則化する空間キューを逆伝播します。さまざまなデータセットのいくつかのアーキテクチャでこの手法を検証し、競合するベースラインと比較して大幅な改善を示しています。
Understanding visual scenes relies more and more on dense pixel-wise classification obtained via deep fully convolutional neural networks. However, due to the nature of the networks, predictions often suffer from blurry boundaries and ill-segmented shapes, fueling the need for post-processing. This work introduces a new semantic segmentation regularization based on the regression of a distance transform. After computing the distance transform on the label masks, we train a FCN in a multi-task setting in both discrete and continuous spaces by learning jointly classification and distance regression. This requires almost no modification of the network structure and adds a very low overhead to the training process. Learning to approximate the distance transform back-propagates spatial cues that implicitly regularizes the segmentation. We validate this technique with several architectures on various datasets, and we show significant improvements compared to competitive baselines.
updated: Wed Sep 04 2019 10:05:08 GMT+0000 (UTC)
published: Wed Sep 04 2019 10:05:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト