arXiv reaDer
極値としてのオブジェクト
Objects as Extreme Points
オブジェクト検出はピクセルクラスタリングタスクと見なすことができ、その境界は4つの極値点(左端、上、右端、下)によって決定されます。ただし、ほとんどの研究では、オブジェクトの中心点またはコーナーポイントに焦点が当てられています。これらは、実際には極値の条件付き結果です。この論文では、各ピクセルと4つの極値点の間の相対変位ベクトルを直接回帰する極値予測ベースのオブジェクト検出器(EPP-Net)を紹介します。また、極値の2つのグループ間の類似性を測定するための新しいメトリック、つまり、Extreme Intersection over Union(EIoU)を提案し、このEIoUを新しい回帰損失として組み込みます。さらに、グラウンドトゥルースと予測結果の間のEIoUを予測し、それを非最大抑制のランキングキーワードとして分類信頼度と組み合わせるための新しいブランチを提案します。 MS-COCOデータセットでは、この方法により、ResNet-50で44.0%の平均精度(AP)が達成され、ResNeXt-101-DCNで48.3%のAPが達成されます。提案されたEPP-Netは、オブジェクトを検出するための新しい方法を提供し、最先端のアンカーフリー検出器よりも優れています。
Object detection can be regarded as a pixel clustering task, and its boundary is determined by four extreme points (leftmost, top, rightmost, and bottom). However, most studies focus on the center or corner points of the object, which are actually conditional results of the extreme points. In this paper, we present an Extreme-Point-Prediction-Based object detector (EPP-Net), which directly regresses the relative displacement vector between each pixel and the four extreme points. We also propose a new metric to measure the similarity between two groups of extreme points, namely, Extreme Intersection over Union (EIoU), and incorporate this EIoU as a new regression loss. Moreover, we propose a novel branch to predict the EIoU between the ground-truth and the prediction results, and combine it with the classification confidence as the ranking keyword in non-maximum suppression. On the MS-COCO dataset, our method achieves an average precision (AP) of 44.0% with ResNet-50 and an AP of 48.3% with ResNeXt-101-DCN. The proposed EPP-Net provides a new method to detect objects and outperforms state-of-the-art anchor-free detectors.
updated: Thu May 20 2021 08:33:11 GMT+0000 (UTC)
published: Thu Apr 29 2021 01:01:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト