デジタル農業サービスのアプリケーションでは、多くの場合、農民またはその顧問のいずれかが畑の境界のデジタル記録を提供する必要があります。衛星画像からのフィールド境界の自動抽出は、これらのレコードの手動入力への依存を減らし、時間がかかり、エラーが発生しやすく、リモート製品およびサービスの提供を支えます。現在のフィールド境界データセットの欠如は、おそらく高価な画像前処理要件とローカルの、しばしば任意のチューニングのために、既存のメソッドの取り込みが少ないことを示しているようです。本論文では、衛星画像からのフィールド境界抽出の問題をマルチタスクのセマンティックセグメンテーション問題として扱います。拡張された畳み込みと条件付き推論を特徴とする完全に接続されたUNetバックボーンを備えた深い畳み込みニューラルネットワークであるResUNet-aを使用して、各ピクセルに3つのラベルを割り当てました。1)フィールドに属する確率。 2)境界の一部である確率。および3)最も近い境界までの距離。これらのラベルを組み合わせて、閉じたフィールド境界を取得できます。 Sentinel-2の単一の合成画像を使用すると、モデルはフィールド範囲、フィールド境界、および結果として個々のフィールドのマッピングにおいて非常に正確でした。毎月の合成を合成期間に近い単一の日付の画像に置き換えると、精度がわずかに低下しました。その後、一連の実験で、モデルが解像度、センサー、空間、時間全体にわたって再キャリブレーションなしで一般化されたことを示しました。季節を通じて取得した少なくとも4つの画像からモデル予測を平均化してコンセンサスを構築することは、精度の時間的変動に対処するための鍵です。画像の前処理要件を最小限に抑え、ローカルの任意の決定をデータ駆動型の決定に置き換えることにより、私たちのアプローチは大規模な個々の作物畑の抽出を促進することが期待されます。
Applications of digital agricultural services often require either farmers or their advisers to provide digital records of their field boundaries. Automatic extraction of field boundaries from satellite imagery would reduce the reliance on manual input of these records which is time consuming and error-prone, and would underpin the provision of remote products and services. The lack of current field boundary data sets seems to indicate low uptake of existing methods,presumably because of expensive image preprocessing requirements and local, often arbitrary, tuning. In this paper, we address the problem of field boundary extraction from satellite images as a multitask semantic segmentation problem. We used ResUNet-a, a deep convolutional neural network with a fully connected UNet backbone that features dilated convolutions and conditioned inference, to assign three labels to each pixel: 1) the probability of belonging to a field; 2) the probability of being part of a boundary; and 3) the distance to the closest boundary. These labels can then be combined to obtain closed field boundaries. Using a single composite image from Sentinel-2, the model was highly accurate in mapping field extent, field boundaries, and, consequently, individual fields. Replacing the monthly composite with a single-date image close to the compositing period only marginally decreased accuracy. We then showed in a series of experiments that our model generalised well across resolutions, sensors, space and time without recalibration. Building consensus by averaging model predictions from at least four images acquired across the season is the key to coping with the temporal variations of accuracy. By minimising image preprocessing requirements and replacing local arbitrary decisions by data-driven ones, our approach is expected to facilitate the extraction of individual crop fields at scale.