arXiv reaDer
Encoder-Decoder based CNN and Fully Connected CRFs for Remote Sensed Image Segmentation
  リモートセンシングイメージングの進歩により、大量の非常に高解像度の土地被覆画像を取得できるようになりました。ただし、これらの2D画像でのオブジェクト認識の自動化は依然として重要な問題です。超高解像度(VHR)画像のクラス内分散が高く、クラス間分散が低いと、オブジェクト認識タスクの予測の精度が低下します。さまざまなコンピュータービジョンタスクで最近成功したテクニックのほとんどは、深い教師付き学習に基づいています。この作業では、スキップ接続を備えた対称エンコーダーデコーダーアーキテクチャに基づく深い畳み込みニューラルネットワーク(CNN)を使用して、ほとんどの一般的な土地被覆オブジェクトクラス(不浸透面、建物、低植生、木、自動車)の2Dセマンティックセグメンテーションを行います。提案されたCNNモデルで大きな受容フィールドを持つために、アトラス畳み込みが採用されています。さらに、CNN出力は、完全に接続された条件付きランダムフィールド(FCRF)モデルを使用して後処理され、CNNピクセルラベル予測が改善されます。提案されたCNN-FCRFモデルは、ISPRS Vaihingenデータセットで90.5%の全体的な精度を達成します。
With the advancement of remote-sensed imaging large volumes of very high resolution land cover images can now be obtained. Automation of object recognition in these 2D images, however, is still a key issue. High intra-class variance and low inter-class variance in Very High Resolution (VHR) images hamper the accuracy of prediction in object recognition tasks. Most successful techniques in various computer vision tasks recently are based on deep supervised learning. In this work, a deep Convolutional Neural Network (CNN) based on symmetric encoder-decoder architecture with skip connections is employed for the 2D semantic segmentation of most common land cover object classes - impervious surface, buildings, low vegetation, trees and cars. Atrous convolutions are employed to have large receptive field in the proposed CNN model. Further, the CNN outputs are post-processed using Fully Connected Conditional Random Field (FCRF) model to refine the CNN pixel label predictions. The proposed CNN-FCRF model achieves an overall accuracy of 90.5% on the ISPRS Vaihingen Dataset.
updated: Mon Oct 14 2019 11:22:18 GMT+0000 (UTC)
published: Mon Oct 14 2019 11:22:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト