IoU-balanced Loss Functions for Single-stage Object Detection
単段物体検出器は、その効率が高いため、コンピュータビジョンアプリケーションに広く適用されています。ただし、単段物体検出器で採用されている損失関数は、位置特定の精度に深刻な影響を与えることがわかりました。まず、分類の標準的なクロスエントロピー損失は、ローカリゼーションタスクとは無関係であり、トレーニング中のローカリゼーションの精度に関係なく、すべての肯定的な例を可能な限り高い分類スコアで学習します。その結果、分類スコアは高いがIoUが低い検出や、分類スコアは低いがIoUが高い検出が多数発生します。次に、標準の滑らかなL1損失の場合、勾配は、トレーニング中のローカリゼーションの精度が低い外れ値によって支配されます。上記の2つの問題により、単段検出器の位置特定精度が低下します。この作業では、上記の問題を解決するために、IoUバランス分類損失とIoUバランスローカリゼーション損失で構成されるIoUバランス損失関数を提案します。 IoUバランスのとれた分類損失は、IoUが高い肯定的な例にさらに注意を払い、分類タスクとローカリゼーションタスクの間の相関を高めることができます。 IoUバランスのとれたローカリゼーション損失は、IoUが低い例の勾配を減らし、IoUが高い例の勾配を増やします。これにより、モデルのローカリゼーション精度を向上させることができます。 MS COCO、PASCAL VOC、Cityscapesなどの挑戦的な公開データセットに関する広範な実験は、両方のIoUバランスの取れた損失が、特にローカリゼーションの精度に関して、人気のある単段検出器に大幅な改善をもたらすことができることを示しています。 COCO test-devでは、提案された方法により、APが1.0%〜1.7%、AP75が1.0%〜2.4%大幅に改善されます。 PASCAL VOCでは、APを1.3%〜1.5%、AP80、AP90を1.6%〜3.9%大幅に改善することもできます。
Single-stage object detectors have been widely applied in computer vision applications due to their high efficiency. However, we find that the loss functions adopted by single-stage object detectors hurt the localization accuracy seriously. Firstly, the standard cross-entropy loss for classification is independent of the localization task and drives all the positive examples to learn as high classification scores as possible regardless of localization accuracy during training. As a result, there will be many detections that have high classification scores but low IoU or detections that have low classification scores but high IoU. Secondly, for the standard smooth L1 loss, the gradient is dominated by the outliers that have poor localization accuracy during training. The above two problems will decrease the localization accuracy of single-stage detectors. In this work, IoU-balanced loss functions that consist of IoU-balanced classification loss and IoU-balanced localization loss are proposed to solve the above problems. The IoU-balanced classification loss pays more attention to positive examples with high IoU and can enhance the correlation between classification and localization tasks. The IoU-balanced localization loss decreases the gradient of examples with low IoU and increases the gradient of examples with high IoU, which can improve the localization accuracy of models. Extensive experiments on challenging public datasets such as MS COCO, PASCAL VOC and Cityscapes demonstrate that both IoU-balanced losses can bring substantial improvement for the popular single-stage detectors, especially for the localization accuracy. On COCO test-dev, the proposed methods can substantially improve AP by 1.0%∼1.7% and AP75 by 1.0%∼2.4%. On PASCAL VOC, it can also substantially improve AP by 1.3%∼1.5% and AP80, AP90 by 1.6%∼3.9%.
updated: Mon Dec 14 2020 08:07:55 GMT+0000 (UTC)
published: Thu Aug 15 2019 17:08:22 GMT+0000 (UTC)
