農業地域での視覚的パターン認識は、航空画像処理の重要なアプリケーションです。この論文では、農業航空画像のマルチモダリティの性質を考慮し、特徴の相違を考慮せずに異なるモダリティを単純に組み合わせると、最適ではない結果につながる可能性があることを示します。したがって、機能の相違を軽減するために、Switchable Normalization ブロックを DeepLabV3 セグメンテーション モデルに適用します。一般的な対称型カルバック・ライブラー ダイバージェンス測定値を使用して、モデルが RGB チャネルと近赤外線チャネル間のダイバージェンスを大幅に削減できることを示します。ハイブリッド損失関数と組み合わせることで、私たちのモデルは、以前に公開されたベースラインよりも平均 IoU でほぼ 10% の改善を達成しています。
Visual pattern recognition over agricultural areas is an important application of aerial image processing. In this paper, we consider the multi-modality nature of agricultural aerial images and show that naively combining different modalities together without taking the feature divergence into account can lead to sub-optimal results. Thus, we apply a Switchable Normalization block to our DeepLabV3 segmentation model to alleviate the feature divergence. Using the popular symmetric Kullback Leibler divergence measure, we show that our model can greatly reduce the divergence between RGB and near-infrared channels. Together with a hybrid loss function, our model achieves nearly 10% improvements in mean IoU over previously published baseline.