脆弱な道路利用者を確実に検出することは、不均一な交通に自動運転車を配備するためのセーフティクリティカルな要件です。最も複雑な未解決の課題の1つは、別の前景オブジェクトによる障害物のために、ターゲットオブジェクトがセンサーで部分的にしか利用できない部分的なオクルージョンの問題です。いくつかの主要な歩行者検出ベンチマークは、部分的な咬合の注釈を提供しますが、各ベンチマークは、咬合の発生と重症度の定義が大きく異なります。最近の研究によると、これらのケースでは、高度な主観性を使用して閉塞レベルを分類しており、閉塞は通常、部分的および重度の閉塞など、2〜3の広いカテゴリに分類されます。これにより、使用されているベンチマークによっては、歩行者検出モデルのパフォーマンスのレポートが不正確または一貫性がなくなる可能性があります。この研究では、歩行者検出モデルの客観的な特性評価を容易にするために、部分的に閉塞された歩行者検出のための新しい客観的なベンチマークを紹介します。特性評価は、0〜99%の範囲の閉塞レベルで7つの一般的な歩行者検出モデルで実行されます。結果は、歩行者検出のパフォーマンスが低下し、歩行者の閉塞レベルが増加するにつれて、偽陰性検出の数が増加することを示しています。特徴づけられた7つの人気のある歩行者検出ルーチンの中で、CenterNetが最も優れた全体的なパフォーマンスを示し、SSDliteがそれに続きます。 RetinaNetは、オクルージョンレベルの範囲全体で全体的な検出パフォーマンスが最も低くなっています。
Robust detection of vulnerable road users is a safety critical requirement for the deployment of autonomous vehicles in heterogeneous traffic. One of the most complex outstanding challenges is that of partial occlusion where a target object is only partially available to the sensor due to obstruction by another foreground object. A number of leading pedestrian detection benchmarks provide annotation for partial occlusion, however each benchmark varies greatly in their definition of the occurrence and severity of occlusion. Recent research demonstrates that a high degree of subjectivity is used to classify occlusion level in these cases and occlusion is typically categorized into 2 to 3 broad categories such as partially and heavily occluded. This can lead to inaccurate or inconsistent reporting of pedestrian detection model performance depending on which benchmark is used. This research introduces a novel, objective benchmark for partially occluded pedestrian detection to facilitate the objective characterization of pedestrian detection models. Characterization is carried out on seven popular pedestrian detection models for a range of occlusion levels from 0-99%. Results demonstrate that pedestrian detection performance degrades, and the number of false negative detections increase as pedestrian occlusion level increases. Of the seven popular pedestrian detection routines characterized, CenterNet has the greatest overall performance, followed by SSDlite. RetinaNet has the lowest overall detection performance across the range of occlusion levels.