非常に高解像度の衛星(VHR)画像からの道路抽出は、リモートセンシングの分野で最も重要なトピックの1つです。本論文では、グローバル機能間の関係を把握できる非ローカルブロックを備えた効率的な非ローカルLinkNetを提案した。これにより、各空間特徴点が他のすべてのコンテキスト情報を参照できるようになり、より正確な道路セグメンテーションが実現します。詳細には、CRFリファインメントのような後処理のない単一モデルは、公式のDeepGlobeチャレンジで公開されている他の最先端のアンサンブルモデルよりも優れたパフォーマンスを示しました。さらに、NL-LinkNetは、DeepGlobeチャレンジの勝者であるD-LinkNetを打ち負かし、パラメーターが43%少なく、1秒あたりのギガ浮動小数点演算(GFLOP)が少なく、トレーニングの収束時間が短くなっています。また、ベースラインモデルの非ローカルブロックの適切な使用法に関する経験的分析も示します。
Road extraction from very high resolution satellite (VHR) images is one of the most important topics in the field of remote sensing. In this paper, we propose an efficient Non-Local LinkNet with non-local blocks that can grasp relations between global features. This enables each spatial feature point to refer to all other contextual information and results in more accurate road segmentation. In detail, our single model without any post-processing like CRF refinement, performed better than any other published state-of-the-art ensemble model in the official DeepGlobe Challenge. Moreover, our NL-LinkNet beat the D-LinkNet, the winner of the DeepGlobe challenge, with 43 % less parameters, less giga floating-point operations per seconds (GFLOPs) and shorter training convergence time. We also present empirical analyses on the proper usages of non-local blocks for the baseline model.