自動運転などの実用的なアプリケーション用のセマンティックセグメンテーションモジュールを設計する場合、広範囲の画像の破損に関するモジュールの堅牢性を理解することが重要です。全画像分類に関する最近のロバスト性研究がありますが、最新のモデルDeepLabv3 +に基づいて、セマンティックセグメンテーションの徹底的な研究を初めて発表しました。調査の現実性を高めるために、Cityscapes、PASCAL VOC 2012、およびADE20Kから生成された約400,000枚の画像を利用しています。ベンチマーク調査に基づいて、いくつかの新しい洞察を得ます。まず、フルイメージの分類とは逆に、ほとんどの場合、モデルのパフォーマンスはモデルのロバスト性が向上します。次に、一部のアーキテクチャプロパティは、クリーンなデータのみでパフォーマンスを最大化するように設計された高密度予測セルなど、堅牢性に大きく影響します。
When designing a semantic segmentation module for a practical application, such as autonomous driving, it is crucial to understand the robustness of the module with respect to a wide range of image corruptions. While there are recent robustness studies for full-image classification, we are the first to present an exhaustive study for semantic segmentation, based on the state-of-the-art model DeepLabv3+. To increase the realism of our study, we utilize almost 400,000 images generated from Cityscapes, PASCAL VOC 2012, and ADE20K. Based on the benchmark study, we gain several new insights. Firstly, contrary to full-image classification, model robustness increases with model performance, in most cases. Secondly, some architecture properties affect robustness significantly, such as a Dense Prediction Cell, which was designed to maximize performance on clean data only.