最近のオブジェクト検出器は、候補領域を分類しながらインスタンスを見つけます。各領域は独立して評価されるため、検出器からの候補領域の数は通常、オブジェクトの数よりも多くなります。検出の最終目標は各オブジェクトに単一の検出を割り当てることであるため、非最大抑制(NMS)などのヒューリスティックアルゴリズムを使用して、オブジェクトの単一の境界ボックスを選択します。単純なヒューリスティックアルゴリズムはスタンドアロンオブジェクトには効果的ですが、重複したオブジェクトの検出に失敗する可能性があります。このペーパーでは、候補ボックス間の関係を使用して異なるオブジェクトを区別するようにネットワークをトレーニングすることにより、この問題に対処します。インスタンス認識検出ネットワーク(IDNet)を提案します。これは、候補領域から特徴を抽出し、それらの類似性を測定することを学習できます。ペアワイズの類似性と検出品質に基づいて、IDNetはインスタンス対応の決定点プロセス推論(IDPP)を使用して、候補バウンディングボックスのサブセットを選択します。広範な実験により、提案されたアルゴリズムは、PASCAL VOCおよびMS COCOデータセットでの既存の最先端の検出方法と比較して、重なり合ったオブジェクトを検出するための大幅な改善を達成することが実証されています。
Recent object detectors find instances while categorizing candidate regions. As each region is evaluated independently, the number of candidate regions from a detector is usually larger than the number of objects. Since the final goal of detection is to assign a single detection to each object, a heuristic algorithm, such as non-maximum suppression (NMS), is used to select a single bounding box for an object. While simple heuristic algorithms are effective for stand-alone objects, they can fail to detect overlapped objects. In this paper, we address this issue by training a network to distinguish different objects using the relationship between candidate boxes. We propose an instance-aware detection network (IDNet), which can learn to extract features from candidate regions and measure their similarities. Based on pairwise similarities and detection qualities, the IDNet selects a subset of candidate bounding boxes using instance-aware determinantal point process inference (IDPP). Extensive experiments demonstrate that the proposed algorithm achieves significant improvements for detecting overlapped objects compared to existing state-of-the-art detection methods on the PASCAL VOC and MS COCO datasets.