人間は、たとえば衛星から撮られたものなど、画像内の興味深いパターンの検出に優れています。このような事例証拠は、新しい現象の発見につながります。ただし、重要な分析のために主観的特徴の十分なデータを収集することはしばしば困難です。このペーパーでは、クラウドソーシングとディープラーニングの幅広い研究者が最近利用できるようになった2つのツールを組み合わせて、衛星画像を大規模に探索する方法の例を紹介します。特に、貿易風地域における浅い積雲対流の組織に焦点が当てられています。浅い雲は地球の放射バランスに大きな役割を果たしますが、気候モデルでは不十分に表現されています。このプロジェクトでは、組織化の4つの主観的なパターンが定義されました:砂糖、花、魚、砂利。 2つの研究所のクラウドラベル付けの日に、67人の科学者がクラウドソーシングプラットフォームで10,000枚の衛星画像をスクリーニングし、約50,000の中規模のクラウドクラスターを分類しました。このデータセットは、パターン検出を自動化し、4つのパターンのグローバル気候を作成することを可能にするディープラーニングアルゴリズムのトレーニングデータセットとして使用されます。地理的分布と大規模な環境条件の分析は、4つのパターンが、オープンおよびクローズドセル対流などの確立された組織化モードと一部重複するが、重要な点でも異なることを示しています。このプロジェクトの結果とデータセットは、有望な研究課題を示唆しています。さらに、この研究は、クラウドソーシングとディープラーニングが画像データセットの探索のために互いに補完し合うことを示しています。
Humans excel at detecting interesting patterns in images, for example those taken from satellites. This kind of anecdotal evidence can lead to the discovery of new phenomena. However, it is often difficult to gather enough data of subjective features for significant analysis. This paper presents an example of how two tools that have recently become accessible to a wide range of researchers, crowd-sourcing and deep learning, can be combined to explore satellite imagery at scale. In particular, the focus is on the organization of shallow cumulus convection in the trade wind regions. Shallow clouds play a large role in the Earth's radiation balance yet are poorly represented in climate models. For this project four subjective patterns of organization were defined: Sugar, Flower, Fish and Gravel. On cloud labeling days at two institutes, 67 scientists screened 10,000 satellite images on a crowd-sourcing platform and classified almost 50,000 mesoscale cloud clusters. This dataset is then used as a training dataset for deep learning algorithms that make it possible to automate the pattern detection and create global climatologies of the four patterns. Analysis of the geographical distribution and large-scale environmental conditions indicates that the four patterns have some overlap with established modes of organization, such as open and closed cellular convection, but also differ in important ways. The results and dataset from this project suggests promising research questions. Further, this study illustrates that crowd-sourcing and deep learning complement each other well for the exploration of image datasets.