arXiv reaDer
正確なオブジェクト検出のためのマルチグリッド冗長バウンディングボックス注釈
Multi-Grid Redundant Bounding Box Annotation for Accurate Object Detection
最新の主要なオブジェクト検出器は、ディープCNNベースのバックボーン分類器ネットワークから再利用された2ステージまたは1ステージのネットワークです。 YOLOv3は、そのような非常によく知られている最先端のワンショット検出器の1つであり、入力画像を取り込み、それを同じサイズのグリッドマトリックスに分割します。オブジェクトの中心を持つグリッドセルは、特定のオブジェクトを検出する役割を果たします。このホワイトペーパーでは、オブジェクトごとに複数のグリッドを割り当てて、バウンディングボックスを正確に予測する新しい数学的アプローチを紹介します。また、オブジェクト検出のための効果的なオフラインコピーアンドペーストデータ拡張を提案します。私たちが提案する方法は、いくつかの現在の最先端の物体検出器を大幅に上回り、さらに優れた性能が期待できます。
Modern leading object detectors are either two-stage or one-stage networks repurposed from a deep CNN-based backbone classifier network. YOLOv3 is one such very-well known state-of-the-art one-shot detector that takes in an input image and divides it into an equal-sized grid matrix. The grid cell having the center of an object is the one responsible for detecting the particular object. This paper presents a new mathematical approach that assigns multiple grids per object for accurately tight-fit bounding box prediction. We also propose an effective offline copy-paste data augmentation for object detection. Our proposed method significantly outperforms some current state-of-the-art object detectors with a prospect for further better performance.
updated: Wed Jan 05 2022 23:01:55 GMT+0000 (UTC)
published: Wed Jan 05 2022 23:01:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト