Cumulo: A Dataset for Learning Cloud Classes
 将来の気候予測における不確実性の最大の原因の1つは、雲のモデリングと、さまざまな種類の雲が気候システムとどのように相互作用するかを理解する上での制限です。この不確実性を減らすための重要な最初のステップは、高い空間的および時間的解像度で雲のタイプを正確に分類することです。このホワイトペーパーでは、グローバルクラウド分類モデルをトレーニングおよび評価するためのベンチマークデータセットであるCumuloを紹介します。 CloudSatクラウドラベルのピクセル幅の「トラック」とマージされた、1年間の解像度1 kmのMODISハイパースペクトル画像で構成されます。これらの補完的なデータセットをまとめることは、重要な最初のステップであり、機械学習コミュニティが気候変動コミュニティに大きな利益をもたらす革新的な新しい技術を開発できるようにします。 Cumuloを紹介するために、リバーシブルフロー生成モデル(IResNet)を使用したベースラインパフォーマンス分析を提供します。これにより、潜在スペースを探索することにより、特定のクラウドクラスの新しいサブクラスをさらに発見できます。メソッドを比較するために、一連の評価基準を導入して、正確であるだけでなく物理的に現実的なモデルを特定します。 CUMULOはからダウンロードできます。
One of the greatest sources of uncertainty in future climate projections comes from limitations in modelling clouds and in understanding how different cloud types interact with the climate system. A key first step in reducing this uncertainty is to accurately classify cloud types at high spatial and temporal resolution. In this paper, we introduce Cumulo, a benchmark dataset for training and evaluating global cloud classification models. It consists of one year of 1km resolution MODIS hyperspectral imagery merged with pixel-width 'tracks' of CloudSat cloud labels. Bringing these complementary datasets together is a crucial first step, enabling the Machine-Learning community to develop innovative new techniques which could greatly benefit the Climate community. To showcase Cumulo, we provide baseline performance analysis using an invertible flow generative model (IResNet), which further allows us to discover new sub-classes for a given cloud class by exploring the latent space. To compare methods, we introduce a set of evaluation criteria, to identify models that are not only accurate, but also physically-realistic. CUMULO can be download from .
updated: Tue Apr 14 2020 10:01:33 GMT+0000 (UTC)
published: Tue Nov 05 2019 09:36:16 GMT+0000 (UTC)
