ARS-DETR: Transformer を使用した縦横比に敏感な物体検出
ARS-DETR: Aspect Ratio Sensitive Oriented Object Detection with Transformer
既存の指向性オブジェクト検出方法では、一般にメトリック AP_50 を使用してモデルのパフォーマンスを測定します。 AP_50 は、角度偏差の許容範囲が大きいため、向きのあるオブジェクトの検出には本質的に不適切であると主張します。したがって、モデルのパフォーマンスを測定するために、AP_75 などの高精度メトリックを使用することをお勧めします。この論文では、ARS-DETR と呼ばれるトランスフォーマーを備えたアスペクト比センシティブ指向オブジェクト検出器を提案します。これは、高精度の指向オブジェクト検出で競争力のあるパフォーマンスを示します。具体的には、アスペクト比を考慮した Circle Smooth Label (AR-CSL) と呼ばれる新しい角度分類方法が提案され、角度ラベルをより合理的な方法で平滑化し、以前の研究 (CSL など) で導入されたハイパーパラメーターを破棄します。次に,回転変形可能アテンションモジュールを設計して,サンプリング点を対応する角度で回転させ,領域特徴とサンプリング点の間のずれをなくした。また、角度損失の計算にはアスペクト比に応じた動荷重係数を採用しています。いくつかの挑戦的なデータセットでの包括的な実験は、私たちの方法が高精度指向オブジェクト検出タスクで競争力のあるパフォーマンスを達成することを示しています。
Existing oriented object detection methods commonly use metric AP_50 to measure the performance of the model. We argue that AP_50 is inherently unsuitable for oriented object detection due to its large tolerance in angle deviation. Therefore, we advocate using high-precision metric, e.g. AP_75, to measure the performance of models. In this paper, we propose an Aspect Ratio Sensitive Oriented Object Detector with Transformer, termed ARS-DETR, which exhibits a competitive performance in high-precision oriented object detection. Specifically, a new angle classification method, calling Aspect Ratio aware Circle Smooth Label (AR-CSL), is proposed to smooth the angle label in a more reasonable way and discard the hyperparameter that introduced by previous work (e.g. CSL). Then, a rotated deformable attention module is designed to rotate the sampling points with the corresponding angles and eliminate the misalignment between region features and sampling points. Moreover, a dynamic weight coefficient according to the aspect ratio is adopted to calculate the angle loss. Comprehensive experiments on several challenging datasets show that our method achieves competitive performance on the high-precision oriented object detection task.
updated: Wed Apr 03 2024 06:51:21 GMT+0000 (UTC)
published: Thu Mar 09 2023 02:20:56 GMT+0000 (UTC)
