オブジェクト検出では、検出器がターゲットオブジェクトの検出に失敗すると、フォールスネガティブが発生します。オブジェクト検出器がフォールスネガティブを生成する理由を理解するために、5つの「フォールスネガティブメカニズム」を特定します。各メカニズムは、検出器アーキテクチャ内の特定のコンポーネントがどのように失敗したかを示します。 2ステージおよび1ステージのアンカーボックスオブジェクト検出器アーキテクチャに焦点を当て、これらのフォールスネガティブメカニズムを定量化するためのフレームワークを紹介します。このフレームワークを使用して、FasterR-CNNとRetinaNetがベンチマークビジョンデータセットとロボティクスデータセット内のオブジェクトを検出できない理由を調査します。検出器のフォールスネガティブメカニズムは、コンピュータービジョンベンチマークデータセットとロボット工学の展開シナリオの間で大幅に異なることを示します。これは、ベンチマークデータセット用に開発されたオブジェクト検出器のロボット工学アプリケーションへの変換に影響を及ぼします。
In object detection, false negatives arise when a detector fails to detect a target object. To understand why object detectors produce false negatives, we identify five 'false negative mechanisms', where each mechanism describes how a specific component inside the detector architecture failed. Focusing on two-stage and one-stage anchor-box object detector architectures, we introduce a framework for quantifying these false negative mechanisms. Using this framework, we investigate why Faster R-CNN and RetinaNet fail to detect objects in benchmark vision datasets and robotics datasets. We show that a detector's false negative mechanisms differ significantly between computer vision benchmark datasets and robotics deployment scenarios. This has implications for the translation of object detectors developed for benchmark datasets to robotics applications.