セマンティックセグメンテーションタスクは、ピクセル単位のレベルでの高密度分類を目的としています。ディープモデルは、このタスクへの取り組みにおいて進歩を示しました。ただし、これらのアプローチで残っている問題の1つは、セグメント化されたオブジェクトの境界で発生することが多い空間精度の低下です。私たちが提案するモデルは、前者をサポートするグローバル表現を抽出しながら、特徴表現の内部構造を提供することによってこの問題に対処します。内部構造に合わせるために、トレーニング中に、データからガウス混合モデルを予測します。これは、スキップ接続とデコードステージとマージされ、誤った誘導バイアスを回避するのに役立ちます。さらに、私たちの結果は、学習表現(グローバルとローカル)の両方にクラスタリング動作を提供し、それらを組み合わせることによって、セマンティックセグメンテーションを改善できることを示しています。最後に、CityscapesおよびSynthiaデータセットの進歩を示す結果を示します。
The semantic segmentation task aims at dense classification at the pixel-wise level. Deep models exhibited progress in tackling this task. However, one remaining problem with these approaches is the loss of spatial precision, often produced at the segmented objects' boundaries. Our proposed model addresses this problem by providing an internal structure for the feature representations while extracting a global representation that supports the former. To fit the internal structure, during training, we predict a Gaussian Mixture Model from the data, which, merged with the skip connections and the decoding stage, helps avoid wrong inductive biases. Furthermore, our results show that we can improve semantic segmentation by providing both learning representations (global and local) with a clustering behavior and combining them. Finally, we present results demonstrating our advances in Cityscapes and Synthia datasets.