arXiv reaDer
OGMN: UAV 画像のオブジェクト検出のためのオクルージョン ガイド マルチタスク ネットワーク
OGMN: Occlusion-guided Multi-task Network for Object Detection in UAV Images
オブジェクト間のオクルージョンは、UAV 画像のオブジェクト検出で見落とされている課題の 1 つです。 UAV の高度と角度は可変であるため、UAV 画像のオクルージョンは、自然のシーンよりも頻繁に発生します。自然のシーンの画像でのオクルージョンと比較して、UAV 画像でのオクルージョンは、特徴の混乱の問題と局所的な凝集特性で発生します。そして、オブジェクト間のオクルージョンを抽出またはローカライズすることは、検出器がこの課題に対処するのに有益であることがわかりました。この発見によると、オクルージョン ローカリゼーション タスクが導入されました。これは、オブジェクト検出タスクと共に、オクルージョン ガイド マルチタスク ネットワーク (OGMN) を構成します。 OGMN には、オクルージョンのローカリゼーションと、2 つのオクルージョン ガイド付きマルチタスク インタラクションが含まれています。詳細には、オクルージョンを正確にローカライズするために、オクルージョン推定モジュール (OEM) が提案されています。次に、OGMN は、オクルージョン ローカリゼーションの結果を利用して、2 つのマルチタスク インタラクションによるオクルージョン ガイド付き検出を実装します。ガイドの 1 つの相互作用は、機能の混乱の問題に対処するための 2 つのタスク デコーダー間のものであり、一般的な検出ヘッドを置き換えるためにオクルージョン デカップリング ヘッド (ODH) が提案されています。ガイドのための別の相互作用は、局所凝集特性に従って検出プロセスで設計され、検出プロセスを最適化するために 2 フェーズの漸進的改良プロセス (TPP) が提案されています。広範な実験により、Visdrone および UAVDT データセットに対する OGMN の有効性が実証されています。特に、OGMN は Visdrone データセットで 35.0% の mAP を達成し、ベースラインを 5.3% 上回っています。また、当社の OGMN は、正確なオクルージョン ローカリゼーションのための新しい洞察を提供し、競争力のある検出パフォーマンスを実現します。
Occlusion between objects is one of the overlooked challenges for object detection in UAV images. Due to the variable altitude and angle of UAVs, occlusion in UAV images happens more frequently than that in natural scenes. Compared to occlusion in natural scene images, occlusion in UAV images happens with feature confusion problem and local aggregation characteristic. And we found that extracting or localizing occlusion between objects is beneficial for the detector to address this challenge. According to this finding, the occlusion localization task is introduced, which together with the object detection task constitutes our occlusion-guided multi-task network (OGMN). The OGMN contains the localization of occlusion and two occlusion-guided multi-task interactions. In detail, an occlusion estimation module (OEM) is proposed to precisely localize occlusion. Then the OGMN utilizes the occlusion localization results to implement occlusion-guided detection with two multi-task interactions. One interaction for the guide is between two task decoders to address the feature confusion problem, and an occlusion decoupling head (ODH) is proposed to replace the general detection head. Another interaction for guide is designed in the detection process according to local aggregation characteristic, and a two-phase progressive refinement process (TPP) is proposed to optimize the detection process. Extensive experiments demonstrate the effectiveness of our OGMN on the Visdrone and UAVDT datasets. In particular, our OGMN achieves 35.0% mAP on the Visdrone dataset and outperforms the baseline by 5.3%. And our OGMN provides a new insight for accurate occlusion localization and achieves competitive detection performance.
updated: Mon Apr 24 2023 03:30:00 GMT+0000 (UTC)
published: Mon Apr 24 2023 03:30:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト