arXiv reaDer
Extended Agriculture-Vision: 農業パターン分析のための大規模な航空画像データセットの拡張
Extended Agriculture-Vision: An Extension of a Large Aerial Image Dataset for Agricultural Pattern Analysis
リモート センシングおよび地球観測データに関する機械学習作業の多くにとって重要な課題は、正確にラベル付けされた大量のデータを取得することの難しさです。これは特にセマンティック セグメンテーション タスクに当てはまりますが、正確で正確なピクセル レベルの注釈を大規模に収集することは信じられないほど難しいため、リモート センシング ドメインではあまり一般的ではありません。最近の取り組みでは、教師ありデータセットの作成と自己教師あり方法の適用の両方を通じて、これらの課題に対処しています。私たちは、これらの取り組みを両方の面で続けています。まず、実験の柔軟性を高めるために生の全視野画像を含めるために、Agriculture-Vision データセット (Chiu et al., 2020b) の改良版を生成してリリースします。次に、このデータセットを拡張して、3600 枚の大きな高解像度 (10 cm/ピクセル)、フルフィールド、赤、緑、青、および近赤外画像を事前トレーニング用にリリースします。第三に、ピクセルから伝播へのモジュール Xie et al. を組み込みます。 (2021b) は、もともと SimCLR フレームワークを MoCo-V2 Chen et al. (2020b) のフレームワークに組み込みました。最後に、下流の分類タスクとセマンティック セグメンテーション タスクの両方でさまざまな対照学習アプローチをベンチマークすることにより、このデータの有用性を示します。 CNN と Swin Transformer Liu らの両方を調査します。 (2021a) MoCo-V2 に基づくさまざまなフレームワーク内のアーキテクチャ。これらのアプローチを組み合わせることで、航空画像から農地全体で関心のある重要な農業パターンをより適切に検出できるようになり、農家は問題のある地域をタイムリーに警告して管理上の決定を知らせることができます。さらに、これらのデータセットのリリースは、農業のリモート センシングにおけるコンピューター ビジョンの研究の多くの手段をサポートします。
A key challenge for much of the machine learning work on remote sensing and earth observation data is the difficulty in acquiring large amounts of accurately labeled data. This is particularly true for semantic segmentation tasks, which are much less common in the remote sensing domain because of the incredible difficulty in collecting precise, accurate, pixel-level annotations at scale. Recent efforts have addressed these challenges both through the creation of supervised datasets as well as the application of self-supervised methods. We continue these efforts on both fronts. First, we generate and release an improved version of the Agriculture-Vision dataset (Chiu et al., 2020b) to include raw, full-field imagery for greater experimental flexibility. Second, we extend this dataset with the release of 3600 large, high-resolution (10cm/pixel), full-field, red-green-blue and near-infrared images for pre-training. Third, we incorporate the Pixel-to-Propagation Module Xie et al. (2021b) originally built on the SimCLR framework into the framework of MoCo-V2 Chen et al.(2020b). Finally, we demonstrate the usefulness of this data by benchmarking different contrastive learning approaches on both downstream classification and semantic segmentation tasks. We explore both CNN and Swin Transformer Liu et al. (2021a) architectures within different frameworks based on MoCo-V2. Together, these approaches enable us to better detect key agricultural patterns of interest across a field from aerial imagery so that farmers may be alerted to problematic areas in a timely fashion to inform their management decisions. Furthermore, the release of these datasets will support numerous avenues of research for computer vision in remote sensing for agriculture.
updated: Sat Mar 04 2023 17:35:24 GMT+0000 (UTC)
published: Sat Mar 04 2023 17:35:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト