arXiv reaDer
Learning Modulated Loss for Rotated Object Detection
 一般的な回転検出方法では、通常、5つのパラメーター(中心点、幅、高さ、回転角度の座標)を使用して、回転境界ボックスとl1-lossを損失関数として記述します。この論文では、角度の固有の周期性とそれに伴う幅と高さの急激な交換に起因する損失の不連続により、前述の統合がトレーニングの不安定性とパフォーマンスの低下を引き起こす可能性があると主張します。この問題は、測定単位が異なる5つのパラメーター間の回帰の不一致を考慮するとさらに顕著になります。上記の問題を回転感度誤差(RSE)と呼び、損失の不連続性を解消するために変調回転損失を提案します。新しい損失を8パラメーター回帰と組み合わせて、一貫性のないパラメーター回帰の問題をさらに解決します。実験は、公共の航空画像ベンチマークDOTAおよびUCAS-AODでの本手法の最新の性能を示しています。 ICDAR2015、HRSC2016、およびFDDBでその一般化機能も検証されています。定性的な改善は図1に見ることができ、ソースコードは論文の出版とともにリリースされます。
Popular rotated detection methods usually use five parameters (coordinates of the central point, width, height, and rotation angle) to describe the rotated bounding box and l1-loss as the loss function. In this paper, we argue that the aforementioned integration can cause training instability and performance degeneration, due to the loss discontinuity resulted from the inherent periodicity of angles and the associated sudden exchange of width and height. This problem is further pronounced given the regression inconsistency among five parameters with different measurement units. We refer to the above issues as rotation sensitivity error (RSE) and propose a modulated rotation loss to dismiss the loss discontinuity. Our new loss is combined with the eight-parameter regression to further solve the problem of inconsistent parameter regression. Experiments show the state-of-art performances of our method on the public aerial image benchmark DOTA and UCAS-AOD. Its generalization abilities are also verified on ICDAR2015, HRSC2016, and FDDB. Qualitative improvements can be seen in Fig 1, and the source code will be released with the publication of the paper.
updated: Fri Dec 20 2019 13:21:28 GMT+0000 (UTC)
published: Tue Nov 19 2019 14:37:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト