Dense Dilated Convolutions Merging Network(DDCM-Net)と呼ばれるセマンティックマッピング用のネットワークを提案して、建物、路面/道路などの同様の色やテクスチャを持つマルチスケールで複雑な形状のオブジェクトを認識できるディープラーニングアプローチを提供します。非常に高解像度のリモートセンシング画像の木。提案されたDDCM-Netは、さまざまな拡張率でマージされた高密度拡張畳み込みで構成されています。これにより、カーネルの受容野を効果的に拡大でき、さらに重要なことに、ローカルおよびグローバルの融合コンテキスト情報を取得して、周囲の識別能力を促進できます。公開されているISPRS Potsdamデータセットで提案されたDDCM-Netの有効性を実証し、後処理なしでRGBバンドのみを使用することで、F1スコアが92.3%、ユニオン精度を超える平均86.0%のパフォーマンスを達成します。また、IRCMバンドでトレーニングされたDDCM-Netが以前の最先端のアプローチよりも優れたマッピング精度(89.8%F1-score)を取得したISPRS Vaihingenデータセットの結果も示します。
We propose a network for semantic mapping called the Dense Dilated Convolutions Merging Network (DDCM-Net) to provide a deep learning approach that can recognize multi-scale and complex shaped objects with similar color and textures, such as buildings, surfaces/roads, and trees in very high resolution remote sensing images. The proposed DDCM-Net consists of dense dilated convolutions merged with varying dilation rates. This can effectively enlarge the kernels' receptive fields, and, more importantly, obtain fused local and global context information to promote surrounding discriminative capability. We demonstrate the effectiveness of the proposed DDCM-Net on the publicly available ISPRS Potsdam dataset and achieve a performance of 92.3% F1-score and 86.0% mean intersection over union accuracy by only using the RGB bands, without any post-processing. We also show results on the ISPRS Vaihingen dataset, where the DDCM-Net trained with IRRG bands, also obtained better mapping accuracy (89.8% F1-score) than previous state-of-the-art approaches.