arXiv reaDer
RGB衛星画像を使用した都市規模の建物のフットプリント抽出のためのセマンティックセグメンテーションネットワーク
A Semantic Segmentation Network for Urban-Scale Building Footprint Extraction Using RGB Satellite Imagery
都市部は世界のエネルギーの3分の2以上を消費し、世界のCO2排出量の70%以上を占めています。 IPCCの1.5Cの地球温暖化報告書で述べられているように、2050年までにカーボンニュートラルを達成するには、グローバルな状況で適用できるスケーラブルなアプローチが必要です。建物のエネルギー使用量と排出量に関するデータを収集する従来の方法は非常に高価であり、すべての都市がすぐに利用できるわけではない特殊な形状情報を必要とします。衛星画像からの高品質の建物フットプリントの生成は、この予測プロセスを加速し、大規模な地方自治体の意思決定を強化することができます。ただし、以前の深層学習ベースのアプローチでは、点群データ、建物の高さ情報、マルチバンド画像などの補足データが使用されます。これらのデータは、可用性が限られており、作成が困難です。この論文では、拡張ResNetバックボーンを備えた修正DeeplabV3 +モジュールを提案して、3チャンネルのRGB衛星画像のみから建物のフットプリントのマスクを生成します。さらに、モデルが偏ったクラス分布を説明できるように、目的関数にFベータメジャーを導入します。 F-Beta目的関数に加えて、指数関数的に重み付けされた境界損失を組み込み、クロスデータセットトレーニング戦略を使用して予測の品質をさらに向上させます。その結果、3つの標準ベンチマークで最先端のパフォーマンスを達成し、RGBのみの方法が衛星画像のスケール、解像度、都市密度にとらわれないことを示しています。
Urban areas consume over two-thirds of the world's energy and account for more than 70 percent of global CO2 emissions. As stated in IPCC's Global Warming of 1.5C report, achieving carbon neutrality by 2050 requires a scalable approach that can be applied in a global context. Conventional methods of collecting data on energy use and emissions of buildings are extremely expensive and require specialized geometry information that not all cities have readily available. High-quality building footprint generation from satellite images can accelerate this predictive process and empower municipal decision-making at scale. However, previous deep learning-based approaches use supplemental data such as point cloud data, building height information, and multi-band imagery - which has limited availability and is difficult to produce. In this paper, we propose a modified DeeplabV3+ module with a Dilated ResNet backbone to generate masks of building footprints from only three-channel RGB satellite imagery. Furthermore, we introduce an F-Beta measure in our objective function to help the model account for skewed class distributions. In addition to an F-Beta objective function, we incorporate an exponentially weighted boundary loss and use a cross-dataset training strategy to further increase the quality of predictions. As a result, we achieve state-of-the-art performance across three standard benchmarks and demonstrate that our RGB-only method is agnostic to the scale, resolution, and urban density of satellite imagery.
updated: Fri Apr 02 2021 22:32:04 GMT+0000 (UTC)
published: Fri Apr 02 2021 22:32:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト