ほとんどのオブジェクト検出アルゴリズムは、2ステージ検出器と1ステージ検出器の2つのクラスに分類できます。最近、シンプルで効果的なアーキテクチャのために、1段検出器に多くの努力が注がれています。 2ステージ検出器とは異なり、1ステージ検出器は、単一のステージですべての候補から前景オブジェクトを識別することを目的としています。このアーキテクチャは効率的ですが、2つの側面に関して不均衡の問題が発生する可能性があります。フォアグラウンドクラスとバックグラウンドクラスからの候補数間のクラス間の不均衡と、バックグラウンド候補の硬度におけるクラス内不均衡です。識別が困難です。この作業では、課題を処理するための新しい分布ランキング(DR)損失を提案します。画像ごとに、分類問題をランク付け問題に変換します。これは、画像内の候補のペアを考慮して、クラス間の不均衡問題に対処します。次に、前景と背景の信頼スコアの分布を決定境界に向かってプッシュします。その後、元のペアの代わりに、派生分布の期待値のランクを最適化します。私たちの方法は、バックグラウンド候補のクラス内の不均衡の問題を軽減するだけでなく、ランキングアルゴリズムの効率も向上させます。 RetinaNetの焦点損失を開発されたDR損失に置き換えるだけで、ResNet-101をバックボーンとして適用することで、COCOのシングルスケールテストのmAPを39.1%から41.7%に改善できます。提案された損失関数。コードはhttps://github.com/idstcv/DR_lossで入手できます。
Most of object detection algorithms can be categorized into two classes: two-stage detectors and one-stage detectors. Recently, many efforts have been devoted to one-stage detectors for the simple yet effective architecture. Different from two-stage detectors, one-stage detectors aim to identify foreground objects from all candidates in a single stage. This architecture is efficient but can suffer from the imbalance issue with respect to two aspects: the inter-class imbalance between the number of candidates from foreground and background classes and the intra-class imbalance in the hardness of background candidates, where only a few candidates are hard to be identified. In this work, we propose a novel distributional ranking (DR) loss to handle the challenge. For each image, we convert the classification problem to a ranking problem, which considers pairs of candidates within the image, to address the inter-class imbalance problem. Then, we push the distributions of confidence scores for foreground and background towards the decision boundary. After that, we optimize the rank of the expectations of derived distributions in lieu of original pairs. Our method not only mitigates the intra-class imbalance issue in background candidates but also improves the efficiency for the ranking algorithm. By merely replacing the focal loss in RetinaNet with the developed DR loss and applying ResNet-101 as the backbone, mAP of the single-scale test on COCO can be improved from 39.1% to 41.7% without bells and whistles, which demonstrates the effectiveness of the proposed loss function. Code is available at https://github.com/idstcv/DR_loss.