arXiv reaDer
Feature Fusion Detector for Semantic Cognition of Remote Sensing
  リモートセンシング画像の価値は多くの分野で非常に重要であり、いくつかの認知的アプローチによって改善する必要があります。リモートセンシング検出は、セマンティック認識を実現するための適切な方法です。ただし、このような検出は、スケールの多様性、ビューの多様性、小さなオブジェクト、洗練された光と影の背景にとっては難しい問題です。最先端の検出フレームワークFPNに触発されたこの記事では、検出におけるフィーチャコンテキストの使用を最適化するフィーチャフュージョンモジュールを構築するための新しいアプローチを提案し、レイヤー弱化フィーチャフュージョンネットワークのシステムLFFNを呼び出します。最終決定に対するさまざまなレイヤーの固有の関連性、および下位レベルの機能に対する上位レベルの機能のインセンティブを調査します。さらに重要なことは、基本機能のマイニングと畳み込みチャネルの相関利用におけるさまざまなバックボーンネットワークの特性を調査し、アップグレード版を高度なLFFNと呼びます。 Google Earthのリモートセンシングデータセットの実験に基づいて、LFFNはリモートセンシングのセマンティック認識に効果的かつ実用的であることが証明され、FPNより4.1%高い89%mAPを達成しました。さらに、一般化パフォーマンスの観点から、LFFNはVOC 2007で79.9%mAPを達成し、VOC 2012テストで73.0%mAPを達成しました。最先端のSSDおよびFaster R-CNNモデル。
The value of remote sensing images is of vital importance in many areas and needs to be refined by some cognitive approaches. The remote sensing detection is an appropriate way to achieve the semantic cognition. However, such detection is a challenging issue for scale diversity, diversity of views, small objects, sophisticated light and shadow backgrounds. In this article, inspired by the state-of-the-art detection framework FPN, we propose a novel approach for constructing a feature fusion module that optimizes feature context utilization in detection, calling our system LFFN for Layer-weakening Feature Fusion Network. We explore the inherent relevance of different layers to the final decision, and the incentives of higher-level features to lower-level features. More importantly, we explore the characteristics of different backbone networks in the mining of basic features and the correlation utilization of convolutional channels, and call our upgraded version as advanced LFFN. Based on experiments on the remote sensing dataset from Google Earth, our LFFN has proved effective and practical for the semantic cognition of remote sensing, achieving 89% mAP which is 4.1% higher than that of FPN. Moreover, in terms of the generalization performance, LFFN achieves 79.9% mAP on VOC 2007 and achieves 73.0% mAP on VOC 2012 test, and advacned LFFN obtains the mAP values of 80.7% and 74.4% on VOC 2007 and 2012 respectively, outperforming the comparable state-of-the-art SSD and Faster R-CNN models.
updated: Sat Sep 28 2019 08:30:03 GMT+0000 (UTC)
published: Sat Sep 28 2019 08:30:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト