arXiv reaDer
Objects as Extreme Points
オブジェクト検出はピクセルクラスタリングタスクと見なすことができ、その境界は4つの極値点(左端、上、右端、下)によって決定されます。ただし、ほとんどの研究では、オブジェクトの中心点またはコーナーポイントに焦点が当てられています。これらは、実際には極値の条件付き結果です。この論文では、各ピクセルと4つの極値点の間の相対変位ベクトルを直接回帰する極値予測ベースのオブジェクト検出器(EPP-Net)を紹介します。また、極値の2つのグループ間の類似性を測定するための新しいメトリック、つまり、Extreme Intersection over Union(EIoU)を提案し、このEIoUを新しい回帰損失として組み込みます。さらに、グラウンドトゥルースと予測結果の間のEIoUを予測するための新しいブランチを提案し、それをローカリゼーションの信頼性として使用して、不十分な検出結果を除外します。 MS-COCOデータセットでは、この方法により、ResNet-50で44.0%の平均精度(AP)が達成され、ResNeXt-101-DCNで50.3%のAPが達成されます。提案されたEPP-Netは、オブジェクトを検出するための新しい方法を提供し、最先端のアンカーフリー検出器よりも優れています。
Object detection can be regarded as a pixel clustering task, and its boundary is determined by four extreme points (leftmost, top, rightmost, and bottom). However, most studies focus on the center or corner points of the object, which are actually conditional results of the extreme points. In this paper, we present an Extreme-Point-Prediction- Based object detector (EPP-Net), which directly regresses the relative displacement vector between each pixel and the four extreme points. We also propose a new metric to measure the similarity between two groups of extreme points, namely, Extreme Intersection over Union (EIoU), and incorporate this EIoU as a new regression loss. Moreover, we propose a novel branch to predict the EIoU between the ground-truth and the prediction results, and take it as the localization confidence to filter out poor detection results. On the MS-COCO dataset, our method achieves an average precision (AP) of 44.0% with ResNet-50 and an AP of 50.3% with ResNeXt-101-DCN. The proposed EPP-Net provides a new method to detect objects and outperforms state-of-the-art anchor-free detectors.
updated: Sat May 22 2021 07:17:52 GMT+0000 (UTC)
published: Thu Apr 29 2021 01:01:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト