arXiv reaDer
確率的セマンティックセグメンテーションのための較正された敵対的改良
Calibrated Adversarial Refinement for Stochastic Semantic Segmentation
セマンティックセグメンテーションタスクでは、入力画像に複数のもっともらしい解釈が含まれることが多いため、複数の有効なラベルが可能になります。このようなあいまいさを捉えるために、最近の研究では、予測の分布を学習できる確率的ネットワークの使用が検討されています。ただし、これらは必ずしも経験分布を正確に表すわけではありません。この作業では、セマンティックマップ上で較正された予測分布を学習するための戦略を提示します。ここで、各予測に関連付けられた確率は、そのグラウンドトゥルースの正しさの可能性を反映します。この目的のために、我々は、較正された敵対的改良のための新しい2段階のカスケードアプローチを提案します:(i)標準セグメンテーションネットワークは、セマンティッククラス全体のピクセル単位の確率分布を予測するためにカテゴリクロスエントロピーで訓練され、(ii)敵対的に訓練された確率的ネットワークは、ピクセル間の相関をモデル化して、最初のネットワークの出力をコヒーレントサンプルに洗練するために使用されます。重要なのは、リファインメントネットワークを調整し、モードの崩壊を防ぐために、第2段階のサンプルの期待値を、第1段階で予測された確率と一致させることです。マルチグレーダーLIDCデータセットとあいまいさを注入した修正Cityscapesデータセットで最先端の結果を達成することにより、アプローチの多様性と堅牢性を示します。さらに、おもちゃの回帰データセットで実験することにより、コア設計を、較正された予測分布の学習を必要とする他のタスクに適合させることができることを示します。 https://github.com/EliasKassapis/CARSSSでメソッドのオープンソース実装を提供しています。
In semantic segmentation tasks, input images can often have more than one plausible interpretation, thus allowing for multiple valid labels. To capture such ambiguities, recent work has explored the use of probabilistic networks that can learn a distribution over predictions. However, these do not necessarily represent the empirical distribution accurately. In this work, we present a strategy for learning a calibrated predictive distribution over semantic maps, where the probability associated with each prediction reflects its ground truth correctness likelihood. To this end, we propose a novel two-stage, cascaded approach for calibrated adversarial refinement: (i) a standard segmentation network is trained with categorical cross entropy to predict a pixelwise probability distribution over semantic classes and (ii) an adversarially trained stochastic network is used to model the inter-pixel correlations to refine the output of the first network into coherent samples. Importantly, to calibrate the refinement network and prevent mode collapse, the expectation of the samples in the second stage is matched to the probabilities predicted in the first. We demonstrate the versatility and robustness of the approach by achieving state-of-the-art results on the multigrader LIDC dataset and on a modified Cityscapes dataset with injected ambiguities. In addition, we show that the core design can be adapted to other tasks requiring learning a calibrated predictive distribution by experimenting on a toy regression dataset. We provide an open source implementation of our method at https://github.com/EliasKassapis/CARSSS.
updated: Wed Aug 04 2021 17:04:53 GMT+0000 (UTC)
published: Tue Jun 23 2020 16:39:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト