arXiv reaDer
H2RBox-v2: 対称学習による HBox 教師付き方向オブジェクト検出の強化
H2RBox-v2: Boosting HBox-supervised Oriented Object Detection via Symmetric Learning
自動運転やリモート センシングなどで指向性オブジェクト検出の需要が高まるにつれて、指向性アノテーションは労働集約的な作業になりました。既存の水平方向に注釈が付けられたデータセットを最大限に活用し、注釈のコストを削減するために、水平方向のボックス (HBox) から回転したボックス (RBox) を学習するための弱教師付き検出器 H2RBox が提案され、大きな注目を集めました。このホワイト ペーパーでは、新しいバージョンの H2RBox-v2 を紹介し、HBox で管理されたオブジェクト検出と RBox で管理されたオブジェクト検出の間のギャップをさらに埋めます。反転と回転の一貫性を介して軸対称性を利用することは、理論的分析を通じて利用できますが、H2RBox-v2 は、H2RBox に似た弱い教師付きブランチを使用して、オブジェクトの画像に固有の対称性から方向を学習する新しい自己教師付きブランチに埋め込まれています。 .角度周期性などの周辺問題に対処するためのモジュールによって補完され、安定した効果的なソリューションが実現されます。私たちの知る限り、H2RBox-v2 は、指向性オブジェクト検出のための最初の対称監視パラダイムです。 H2RBox と比較して、私たちの方法は、低いアノテーション品質と不十分なトレーニング データの影響を受けにくく、そのような場合、完全に監視された指向オブジェクト検出器にはるかに近い競争力のあるパフォーマンスを提供することが期待されます。具体的には、DOTA-v1.0/1.5/2.0 での H2RBox-v2 と Rotated FCOS のパフォーマンス比較は、72.31%/64.76%/50.33% 対 72.44%/64.53%/51.77%、HRSC では 89.66% 対 88.99% です。 、および 42.27% 対 FAIR1M の 41.25%。
With the increasing demand for oriented object detection e.g. in autonomous driving and remote sensing, the oriented annotation has become a labor-intensive work. To make full use of existing horizontally annotated datasets and reduce the annotation cost, a weakly-supervised detector H2RBox for learning the rotated box (RBox) from the horizontal box (HBox) has been proposed and received great attention. This paper presents a new version, H2RBox-v2, to further bridge the gap between HBox-supervised and RBox-supervised oriented object detection. While exploiting axisymmetry via flipping and rotating consistencies is available through our theoretical analysis, H2RBox-v2, using a weakly-supervised branch similar to H2RBox, is embedded with a novel self-supervised branch that learns orientations from the symmetry inherent in the image of objects. Complemented by modules to cope with peripheral issues, e.g. angular periodicity, a stable and effective solution is achieved. To our knowledge, H2RBox-v2 is the first symmetry-supervised paradigm for oriented object detection. Compared to H2RBox, our method is less susceptible to low annotation quality and insufficient training data, which in such cases is expected to give a competitive performance much closer to fully-supervised oriented object detectors. Specifically, the performance comparison between H2RBox-v2 and Rotated FCOS on DOTA-v1.0/1.5/2.0 is 72.31%/64.76%/50.33% vs. 72.44%/64.53%/51.77%, 89.66% vs. 88.99% on HRSC, and 42.27% vs. 41.25% on FAIR1M.
updated: Mon Apr 10 2023 06:11:40 GMT+0000 (UTC)
published: Mon Apr 10 2023 06:11:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト