arXiv reaDer
ドローン画像でのオブジェクト検出を高速化するためのグローバル コンテキスト拡張を備えた適応スパース畳み込みネットワーク
Adaptive Sparse Convolutional Networks with Global Context Enhancement for Faster Object Detection on Drone Images
低レイテンシのドローン画像でのオブジェクト検出は、リソースに制約のある無人航空機 (UAV) プラットフォームでは重要ですが、困難なタスクです。この論文では、スパース畳み込みに基づいて検出ヘッドを最適化することを検討します。これは、精度と効率のバランスをとるのに効果的であることが証明されています。それにもかかわらず、小さなオブジェクトのコンテキスト情報の統合が不十分であり、さまざまなスケールの前景が存在する場合のマスク比率の不器用な制御に悩まされています。上記の問題に対処するために、新しいグローバル コンテキスト強化適応スパース畳み込みネットワーク (CEASC) を提案します。最初に、まばらにサンプリングされた機能に基づく統計をグローバルなコンテキストのものに置き換えることにより、コンテキスト強化グループ正規化 (CE-GN) レイヤーを開発し、次に適応マルチレイヤー マスキング戦略を設計して、異なるスケールで最適なマスク比率を生成します。コンパクトなフォアグラウンド カバレッジにより、精度と効率の両方が促進されます。 VisDrone と UAVDT という 2 つの主要なベンチマークに関する広範な実験結果は、CEASC が典型的な最先端の検出フレームワーク (RetinaNet や GFL V1 など) にプラグインすると、GFLOP を著しく削減し、推論手順を加速することを示しています。コードは https://github.com/Cuogeihong/CEASC で入手できます。
Object detection on drone images with low-latency is an important but challenging task on the resource-constrained unmanned aerial vehicle (UAV) platform. This paper investigates optimizing the detection head based on the sparse convolution, which proves effective in balancing the accuracy and efficiency. Nevertheless, it suffers from inadequate integration of contextual information of tiny objects as well as clumsy control of the mask ratio in the presence of foreground with varying scales. To address the issues above, we propose a novel global context-enhanced adaptive sparse convolutional network (CEASC). It first develops a context-enhanced group normalization (CE-GN) layer, by replacing the statistics based on sparsely sampled features with the global contextual ones, and then designs an adaptive multi-layer masking strategy to generate optimal mask ratios at distinct scales for compact foreground coverage, promoting both the accuracy and efficiency. Extensive experimental results on two major benchmarks, i.e. VisDrone and UAVDT, demonstrate that CEASC remarkably reduces the GFLOPs and accelerates the inference procedure when plugging into the typical state-of-the-art detection frameworks (e.g. RetinaNet and GFL V1) with competitive performance. Code is available at https://github.com/Cuogeihong/CEASC.
updated: Sat Mar 25 2023 14:42:50 GMT+0000 (UTC)
published: Sat Mar 25 2023 14:42:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト