航空画像の技術的進歩と都市環境の正確な3D再構築により、都市部の自動分析にますます注目が集まっています。私たちの仕事では、斜め空中画像が与えられた都市モデルの建物構造のライブ分析を可能にする2つの重要な側面、つまり、畳み込みニューラルネットワーク(CNN)による自動建物抽出と空中画像からの選択的リアルタイム深度推定を検討します。移動学習を使用して、都市のシーンを理解するための大規模な地上ベースのデータセットと空中データセットからの少数の画像を組み合わせることにより、リアルタイムの深層オブジェクト検出のためのFaster R-CNNメソッドをトレーニングします選択した評価データセットで抽出を構築するタスクの平均精度(AP)は約80%です。評価では、データセット固有の学習と転移学習の両方に焦点を当てています。さらに、リアルタイムで空中画像からマルチビュー深度推定を可能にするアルゴリズムを提示します。オブジェクト境界でシャープなエッジを保持するために、セミグローバルマッチング(SGM)最適化戦略を採用しています。 Faster R-CNNと組み合わせることで、対象の地域(RoI)で識別される建物を、斜め空中画像から選択的に再構築できます。
With the technological advancements of aerial imagery and accurate 3d reconstruction of urban environments, more and more attention has been paid to the automated analyses of urban areas. In our work, we examine two important aspects that allow live analysis of building structures in city models given oblique aerial imagery, namely automatic building extraction with convolutional neural networks (CNNs) and selective real-time depth estimation from aerial imagery. We use transfer learning to train the Faster R-CNN method for real-time deep object detection, by combining a large ground-based dataset for urban scene understanding with a smaller number of images from an aerial dataset. We achieve an average precision (AP) of about 80% for the task of building extraction on a selected evaluation dataset. Our evaluation focuses on both dataset-specific learning and transfer learning. Furthermore, we present an algorithm that allows for multi-view depth estimation from aerial imagery in real-time. We adopt the semi-global matching (SGM) optimization strategy to preserve sharp edges at object boundaries. In combination with the Faster R-CNN, it allows a selective reconstruction of buildings, identified with regions of interest (RoIs), from oblique aerial imagery.