雲は地球のエネルギー収支において重要な役割を果たしており、その挙動は将来の気候予測における最大の不確実性の 1 つです。衛星観測は雲の反応を理解するのに役立つはずですが、何十年も何ペタバイトものマルチスペクトル雲画像は、これまで限られた用途しか受けていませんでした。この研究では、畳み込みニューラル ネットワークを使用して、新しい自動化された教師なしの雲分類手法を使用してそれらをグループ化することにより、衛星雲観測の次元を減らします。私たちの手法は、回転不変オートエンコーダーと階層的凝集クラスタリングを組み合わせて、生のマルチスペクトル画像のみを入力として使用して、雲のテクスチャ間の意味のある違いを捉える雲クラスターを生成します。したがって、雲クラスは、場所、時間/季節、導出された物理的特性、または事前に指定されたクラス定義に依存することなく定義されます。このアプローチを使用して、独自の新しいクラウド データセットである AI 主導の雲分類アトラス (AICCA) を生成します。これは、NASA の Aqua および Terra 機器の Moderate Resolution Imaging Spectroradiometer (MODIS) からの 22 年間の海洋画像をクラスター化したものです - 800 TB のデータまたは、およそ 100 km x 100 km (128 x 128 ピクセル) の 1 億 9800 万個のパッチを、AI が生成した 42 のクラウド クラスに分類します。 AICCA クラスには、空間情報を使用して明確な地理的分布をもたらす意味のある区別が含まれていることを示し、たとえば、北アメリカと南アメリカの西海岸に沿った層積雲デッキをキャプチャします。 AICCA は、コンパクトな形式のマルチスペクトル画像で情報を提供し、雲の組織パターンのデータ駆動型診断を可能にし、数時間から数十年のタイムスケールで雲の進化に関する洞察を提供し、コアデータへのアクセスを容易にすることで気候研究の民主化を支援します。
Clouds play an important role in the Earth's energy budget and their behavior is one of the largest uncertainties in future climate projections. Satellite observations should help in understanding cloud responses, but decades and petabytes of multispectral cloud imagery have to date received only limited use. This study reduces the dimensionality of satellite cloud observations by grouping them via a novel automated, unsupervised cloud classification technique by using a convolutional neural network. Our technique combines a rotation-invariant autoencoder with hierarchical agglomerative clustering to generate cloud clusters that capture meaningful distinctions among cloud textures, using only raw multispectral imagery as input. Thus, cloud classes are defined without reliance on location, time/season, derived physical properties, or pre-designated class definitions. We use this approach to generate a unique new cloud dataset, the AI-driven cloud classification atlas (AICCA), which clusters 22 years of ocean images from the Moderate Resolution Imaging Spectroradiometer (MODIS) on NASA's Aqua and Terra instruments - 800 TB of data or 198 million patches roughly 100 km x 100 km (128 x 128 pixels) - into 42 AI-generated cloud classes. We show that AICCA classes involve meaningful distinctions that employ spatial information and result in distinct geographic distributions, capturing, for example, stratocumulus decks along the West coasts of North and South America. AICCA delivers the information in multi-spectral images in a compact form, enables data-driven diagnosis of patterns of cloud organization, provides insight into cloud evolution on timescales of hours to decades, and helps democratize climate research by facilitating access to core data.