arXiv reaDer
Gaussian Guided IoU:オブジェクト検出に関するバランスの取れた学習のためのより良いメトリック
Gaussian Guided IoU: A Better Metric for Balanced Learning on Object Detection
ほとんどのアンカーベースの検出器では、Intersection over Union(IoU)が、トレーニング中にアンカーのターゲットを割り当てるために広く利用されています。ただし、IoUは、アンカーの中心がトゥルースボックスの中心に近いことに十分な注意を払っていません。これにより、2つの問題が発生します。(1)ほとんどの細長いオブジェクトに割り当てられるアンカーが1つだけであるため、トレーニング中に細いオブジェクトの監視情報が不十分になり、細いオブジェクトのパフォーマンスが低下します。 (2)IoUは、アンカーの中心にあるフィーチャの受容野とオブジェクトの間の位置合わせ度を正確に表すことができません。したがって、トレーニング中に、受容野がオブジェクトとよりよく整列するいくつかの機能が欠落している一方で、受容野がオブジェクトとより悪く整列するいくつかの機能が採用されます。これは、モデルのローカリゼーションの精度を損ないます。これらの問題を解決するために、まず、アンカーの中心とトゥルースボックスの中心の近さにさらに注意を向けるガウスガイドIoU(GGIoU)を設計します。次に、GGIoUガイド付き割り当て戦略とGGIoUバランスローカリゼーション損失を含むGGIoUバランス学習方法を提案します。この方法では、細いオブジェクトごとに複数のアンカーを割り当て、オブジェクトと適切に位置合わせされた機能にトレーニングプロセスを偏らせることができます。 PASCALVOCやMSCOCOなどの一般的なベンチマークに関する広範な実験により、GGIoUのバランスの取れた学習により、上記の問題を解決し、オブジェクト検出モデルのパフォーマンス、特にローカリゼーションの精度を大幅に向上できることが実証されています。
For most of the anchor-based detectors, Intersection over Union(IoU) is widely utilized to assign targets for the anchors during training. However, IoU pays insufficient attention to the closeness of the anchor's center to the truth box's center. This results in two problems: (1) only one anchor is assigned to most of the slender objects which leads to insufficient supervision information for the slender objects during training and the performance on the slender objects is hurt; (2) IoU can not accurately represent the alignment degree between the receptive field of the feature at the anchor's center and the object. Thus during training, some features whose receptive field aligns better with objects are missing while some features whose receptive field aligns worse with objects are adopted. This hurts the localization accuracy of models. To solve these problems, we firstly design Gaussian Guided IoU(GGIoU) which focuses more attention on the closeness of the anchor's center to the truth box's center. Then we propose GGIoU-balanced learning method including GGIoU-guided assignment strategy and GGIoU-balanced localization loss. The method can assign multiple anchors for each slender object and bias the training process to the features well-aligned with objects. Extensive experiments on the popular benchmarks such as PASCAL VOC and MS COCO demonstrate GGIoU-balanced learning can solve the above problems and substantially improve the performance of the object detection model, especially in the localization accuracy.
updated: Thu Mar 25 2021 05:36:55 GMT+0000 (UTC)
published: Thu Mar 25 2021 05:36:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト