窒素(N)肥料は、作物の収穫量を増やすために農家によって日常的に使用されています。現在、農民は、高解像度の作物Nステータスデータを持っていないため、特定の場所または特定の時間にN肥料を過剰に施用することがよくあります。 Nの使用効率は低く、残りのNは環境に失われる可能性があり、その結果、生産コストが高くなり、環境汚染が発生します。作物のN状態を正確かつタイムリーに推定することは、作物システムの経済的および環境的持続可能性を改善するために重要です。植物組織分析に基づく破壊的なアプローチは、時間がかかり、広い分野では実用的ではありません。リモートセンシングとディープラーニングの最近の進歩は、前述の課題に非破壊的な方法で対処する上で有望であることが示されています。この作業では、新しい深層学習フレームワークを提案します。自己監視型スペクトル空間注意ベースのビジョントランスフォーマー(SSVT)です。提案されたSSVTは、スペクトル注意ブロック(SAB)と空間相互作用ブロック(SIB)を導入します。これにより、UAVデジタル航空画像から空間的特徴とスペクトル的特徴の両方を同時に学習して、小麦畑の正確なNステータスを予測できます。さらに、提案されたフレームワークは、ラベルのないデータからモデルをトレーニングするのに役立つ、ローカルからグローバルへの自己監視学習を導入します。提案されたSSVTは、ResNet、RegNet、EfficientNet、EfficientNetV2、およびテストデータセットと独立したデータセットの両方で元のビジョントランスフォーマーを含む5つの最先端モデルと比較されています。提案されたアプローチは、小麦のN状態推定のための優れた一般化可能性と再現性で、高精度(0.96)を達成しました。
Nitrogen (N) fertilizer is routinely applied by farmers to increase crop yields. At present, farmers often over-apply N fertilizer in some locations or at certain times because they do not have high-resolution crop N status data. N-use efficiency can be low, with the remaining N lost to the environment, resulting in higher production costs and environmental pollution. Accurate and timely estimation of N status in crops is crucial to improving cropping systems' economic and environmental sustainability. Destructive approaches based on plant tissue analysis are time consuming and impractical over large fields. Recent advances in remote sensing and deep learning have shown promise in addressing the aforementioned challenges in a non-destructive way. In this work, we propose a novel deep learning framework: a self-supervised spectral-spatial attention-based vision transformer (SSVT). The proposed SSVT introduces a Spectral Attention Block (SAB) and a Spatial Interaction Block (SIB), which allows for simultaneous learning of both spatial and spectral features from UAV digital aerial imagery, for accurate N status prediction in wheat fields. Moreover, the proposed framework introduces local-to-global self-supervised learning to help train the model from unlabelled data. The proposed SSVT has been compared with five state-of-the-art models including: ResNet, RegNet, EfficientNet, EfficientNetV2 and the original vision transformer on both testing and independent datasets. The proposed approach achieved high accuracy (0.96) with good generalizability and reproducibility for wheat N status estimation.