arXiv reaDer
特徴の切り捨てと弱い注釈への応用を伴うセマンティックセグメンテーションのスペクトル分析
Spectral Analysis for Semantic Segmentation with Applications on Feature Truncation and Weak Annotation
セグメンテーションセグメンテーションのセグメンテーションマップの精度と解像度の間の相関を調査するために、スペクトル分析を提案します。現在のネットワークは、計算コストを軽減するために、画像のダウンサンプリングされたグリッド上のセグメンテーションマップを予測します。さらに、これらのネットワークは、セグメンテーションマップの粗い等高線のみを利用する弱い注釈によってトレーニングできます。セグメンテーションマップの低頻度情報を利用してこれらの作業を成功裏に達成したにもかかわらず、結果として得られるセグメンテーションマップの精度は、オブジェクトの境界に近い領域でも低下する可能性があります。コストとセグメンテーションの精度のバランスをとるために最適なダウンサンプリングされたグリッドを決定する理論的なガイドラインはまだ不明です。周波数領域で目的関数(クロスエントロピー)とネットワークバックプロパゲーションプロセスを分析します。 CNNのクロスエントロピーと主要な機能は、主にセグメンテーションマップの低周波成分によってもたらされることがわかりました。これにより、セグメンテーションマップのダウンサンプリングされたグリッドの有効性を判断するための定量的な結果がさらに得られます。次に、分析は2つのアプリケーションで検証されます。CNN機能と注釈の高周波成分をそれぞれ制限する機能切り捨て方法とブロック単位の注釈です。結果は私たちの分析と一致しています。したがって、セグメンテーションマップの低頻度情報を利用する既存の作業の成功は、現在、理論的基盤を持っています。
We propose spectral analysis to investigate the correlation between the accuracy and the resolution of segmentation maps for semantic segmentation. The current networks predict segmentation maps on the down-sampled grid of images to alleviate the computational cost. Moreover, these networks can be trained by weak annotations that utilize only the coarse contour of segmentation maps. Despite the successful achievement of these works utilizing the low-frequency information of segmentation maps, however, the accuracy of resultant segmentation maps may also be degraded in the regions near object boundaries. It is yet unclear for a theoretical guideline to determine an optimal down-sampled grid to strike the balance between the cost and the accuracy of segmentation. We analyze the objective function (cross-entropy) and network back-propagation process in frequency domain. We discover that cross-entropy and key features of CNN are mainly contributed by the low-frequency components of segmentation maps. This further provides us quantitative results to determine the efficacy of down-sampled grid of segmentation maps. The analysis is then validated on the two applications: the feature truncation method and the block-wise annotation that limit the high-frequency components of the CNN features and annotation, respectively. The results agree with our analysis. Thus the success of the existing work utilizing low-frequency information of segmentation maps now has theoretical foundation.
updated: Sat Oct 23 2021 03:55:18 GMT+0000 (UTC)
published: Mon Dec 28 2020 07:18:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト