arXiv reaDer
G-Rep:任意指向のオブジェクト検出のためのガウス表現
G-Rep: Gaussian Representation for Arbitrary-Oriented Object Detection
任意指向のオブジェクト表現には、指向バウンディングボックス(OBB)、四辺形バウンディングボックス(QBB)、およびポイントセット(PointSet)が含まれます。各表現は、境界の不連続性、正方形のような問題、表現のあいまいさ、孤立点など、その特性に対応する問題に遭遇し、不正確な検出につながります。さまざまな表現に対して多くの効果的な戦略が提案されていますが、統一された解決策はまだありません。ガウスモデリングに基づく現在の検出方法は、このジレンマを打破する可能性を示しています。ただし、OBBに限定されたままです。さらに、この論文では、G-Repと呼ばれる統一されたガウス表現を提案して、OBB、QBB、およびPointSetのガウス分布を構築します。これにより、さまざまな表現や問題に対する統一されたソリューションが実現します。具体的には、PointSetまたはQBBベースのオブジェクトがガウス分布に変換され、最尤推定アルゴリズムを使用してそれらのパラメーターが最適化されます。次に、3つのオプションのガウスメトリックを調べて、優れたパラメータ最適化メカニズムにより、検出器の回帰損失を最適化します。さらに、サンプリングにガウスメトリックを使用して、ラベルの割り当てと回帰損失を調整します。いくつかの公開されているデータセット、DOTA、HRSC2016、UCAS-AOD、およびICDAR2015での実験結果は、任意の方向のオブジェクト検出のために提案された方法の優れたパフォーマンスを示しています。コードはhttps://github.com/open-mmlab/mmrotateでオープンソース化されています。
Arbitrary-oriented object representations contain the oriented bounding box (OBB), quadrilateral bounding box (QBB), and point set (PointSet). Each representation encounters problems that correspond to its characteristics, such as the boundary discontinuity, square-like problem, representation ambiguity, and isolated points, which lead to inaccurate detection. Although many effective strategies have been proposed for various representations, there is still no unified solution. Current detection methods based on Gaussian modeling have demonstrated the possibility of breaking this dilemma; however, they remain limited to OBB. To go further, in this paper, we propose a unified Gaussian representation called G-Rep to construct Gaussian distributions for OBB, QBB, and PointSet, which achieves a unified solution to various representations and problems. Specifically, PointSet or QBB-based objects are converted into Gaussian distributions, and their parameters are optimized using the maximum likelihood estimation algorithm. Then, three optional Gaussian metrics are explored to optimize the regression loss of the detector because of their excellent parameter optimization mechanisms. Furthermore, we also use Gaussian metrics for sampling to align label assignment and regression loss. Experimental results on several public available datasets, DOTA, HRSC2016, UCAS-AOD, and ICDAR2015 show the excellent performance of the proposed method for arbitrary-oriented object detection. The code has been open sourced at https://github.com/open-mmlab/mmrotate.
updated: Tue May 24 2022 05:28:08 GMT+0000 (UTC)
published: Tue May 24 2022 05:28:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト