ディープ ラーニング ベースのコンピューター ビジョン アルゴリズムが改善を続け、最先端の技術を進歩させているため、実世界のデータに対する堅牢性は、データセットでのパフォーマンスに遅れを取り続けています。これにより、アルゴリズムをラボから現実の世界に持ち込むことが難しくなります。モンテカルロ ドロップアウトなどのアンサンブル ベースの不確実性推定アプローチは、このロバスト性の問題に対処する試みとして、多くのアプリケーションでうまく使用されてきました。残念ながら、このようなアンサンブル ベースのアプローチを新しい問題領域に適用できるかどうかは、必ずしも明確ではありません。これはパノプティック セグメンテーションの場合に当てはまります。問題の構造とそれを解決するために設計されたアーキテクチャは、画像分類やセマンティック セグメンテーションとは異なり、サンプル全体の平均を使用する一般的なソリューションを直接適用できないことを意味します。このホワイトペーパーでは、モンテカルロドロップアウトなどのアンサンブルベースの不確実性推定アプローチを、既存のネットワークを変更せずにパノプティックセグメンテーションドメインで使用する方法を示し、パフォーマンスの向上と、さらに重要なことに、によって行われた予測の不確実性のより良い測定の両方を提供します。ネットワーク。結果は、COCO、KITTI-STEP、および VIPER データセットで定量的および定性的に示されます。
As deep learning-based computer vision algorithms continue to improve and advance the state of the art, their robustness to real-world data continues to lag their performance on datasets. This makes it difficult to bring an algorithm from the lab to the real world. Ensemble-based uncertainty estimation approaches such as Monte Carlo Dropout have been successfully used in many applications in an attempt to address this robustness issue. Unfortunately, it is not always clear if such ensemble-based approaches can be applied to a new problem domain. This is the case with panoptic segmentation, where the structure of the problem and architectures designed to solve it means that unlike image classification or even semantic segmentation, the typical solution of using a mean across samples cannot be directly applied. In this paper, we demonstrate how ensemble-based uncertainty estimation approaches such as Monte Carlo Dropout can be used in the panoptic segmentation domain with no changes to an existing network, providing both improved performance and more importantly a better measure of uncertainty for predictions made by the network. Results are demonstrated quantitatively and qualitatively on the COCO, KITTI-STEP and VIPER datasets.