arXiv reaDer
空中画像からのマルチクラス建物セグメンテーションを使用した太陽ポテンシャル評価
Solar Potential Assessment using Multi-Class Buildings Segmentation from Aerial Images
畳み込みニューラルネットワークのようなエンコーダーデコーダーを使用して衛星画像に存在する建物のセマンティックセグメンテーションは、比較的高いピクセル単位のメトリックスコアで実現されています。このホワイトペーパーでは、出力に追加されたクラスと流域処理技術を使用して、インスタンスのセグメンテーションタスクに完全畳み込みニューラルネットワークの能力を活用し、オブジェクトごとのメトリック結果を向上させることを目指しています。また、CutMix混合データ拡張と1サイクル学習率ポリシーが、トレーニングデータへの適合性を高め、パフォーマンスを向上させるためのより優れた正則化方法であることも示しています。さらに、Mixed Precision Trainingは、トレーニング中の安定性と収束を維持しながら、より大きなネットワークとバッチで実験するための柔軟性を提供しました。パイプライン全体でこれらの追加の変更の効果を比較して示し、最終的に、パフォーマンスが向上することが証明されている調整済みのハイパーパラメーターのセットを提供します。
Semantic Segmentation of buildings present in satellite images using encoder-decoder like convolutional neural networks is being achieved with relatively high pixel-wise metric scores. In this paper, we aim to exploit the power of fully convolutional neural networks for an instance segmentation task using extra added classes to the output along with the watershed processing technique to leverage better object-wise metric results. We also show that CutMix mixed data augmentations and the One-Cycle learning rate policy are greater regularization methods to achieve a better fit on the training data and increase performance. Furthermore, Mixed Precision Training provided more flexibility to experiment with bigger networks and batches while maintaining stability and convergence during training. We compare and show the effect of these additional changes throughout our whole pipeline to finally provide a set a tuned hyper-parameters that are proven to perform better.
updated: Mon Nov 22 2021 18:16:07 GMT+0000 (UTC)
published: Mon Nov 22 2021 18:16:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト