arXiv reaDer
ReDet:空中物体検出用の回転等価検出器
ReDet: A Rotation-equivariant Detector for Aerial Object Detection
最近、航空画像での物体検出がコンピュータビジョンで大きな注目を集めています。自然画像のオブジェクトとは異なり、空中オブジェクトは多くの場合、任意の方向で分散されます。したがって、検出器は方向情報をエンコードするためにより多くのパラメータを必要としますが、これはしばしば非常に冗長で非効率的です。さらに、通常のCNNは方向の変化を明示的にモデル化しないため、正確なオブジェクト検出器をトレーニングするには、大量の回転増強データが必要です。この論文では、これらの問題に対処するために回転同変検出器(ReDet)を提案します。これは、回転同変と回転不変性を明示的にエンコードします。より正確には、回転同変ネットワークを検出器に組み込んで、回転同変特徴を抽出します。これにより、方向を正確に予測し、モデルサイズを大幅に削減できます。回転等変特徴に基づいて、回転不変RoI Align(RiRoI Align)も提示します。これは、RoIの方向に従って等変特徴から回転不変特徴を適応的に抽出します。いくつかの挑戦的な航空画像データセットDOTA-v1.0、DOTA-v1.5、およびHRSC2016での広範な実験は、私たちの方法が空中物体検出のタスクで最先端のパフォーマンスを達成できることを示しています。以前の最良の結果と比較して、ReDetはDOTA-v1.0、DOTA-v1.5、およびHRSC2016でそれぞれ1.2、3.5、および2.6 mAPを獲得し、パラメーターの数を60%削減しました(313Mb対121Mb)。コードはhttps://github.com/csuhan/ReDetで入手できます。
Recently, object detection in aerial images has gained much attention in computer vision. Different from objects in natural images, aerial objects are often distributed with arbitrary orientation. Therefore, the detector requires more parameters to encode the orientation information, which are often highly redundant and inefficient. Moreover, as ordinary CNNs do not explicitly model the orientation variation, large amounts of rotation augmented data is needed to train an accurate object detector. In this paper, we propose a Rotation-equivariant Detector (ReDet) to address these issues, which explicitly encodes rotation equivariance and rotation invariance. More precisely, we incorporate rotation-equivariant networks into the detector to extract rotation-equivariant features, which can accurately predict the orientation and lead to a huge reduction of model size. Based on the rotation-equivariant features, we also present Rotation-invariant RoI Align (RiRoI Align), which adaptively extracts rotation-invariant features from equivariant features according to the orientation of RoI. Extensive experiments on several challenging aerial image datasets DOTA-v1.0, DOTA-v1.5 and HRSC2016, show that our method can achieve state-of-the-art performance on the task of aerial object detection. Compared with previous best results, our ReDet gains 1.2, 3.5 and 2.6 mAP on DOTA-v1.0, DOTA-v1.5 and HRSC2016 respectively while reducing the number of parameters by 60% (313 Mb vs. 121 Mb). The code is available at: https://github.com/csuhan/ReDet.
updated: Sat Mar 13 2021 15:37:36 GMT+0000 (UTC)
published: Sat Mar 13 2021 15:37:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト