arXiv reaDer
効率的なオブジェクト検出のための学習済みの 2 平面透視事前ベースの画像リサンプリング
Learned Two-Plane Perspective Prior based Image Resampling for Efficient Object Detection
リアルタイムの効率的な認識は、自律ナビゲーションと都市規模のセンシングにとって重要です。アーキテクチャの改善と直交するストリーミング認識アプローチは、リアルタイム検出パフォーマンスを向上させる適応サンプリングを利用しています。この作業では、効率的なオブジェクト検出のために画像をリサンプリングするために、3D シーン (地面と上の平面) の大まかなジオメトリを組み込んだ学習可能なジオメトリ ガイド付き事前確率を提案します。これにより、小さくて遠くにあるオブジェクトの検出パフォーマンスが大幅に向上すると同時に、レイテンシとメモリの両方の点でより効率的になります。自律ナビゲーションでは、同じ検出器とスケールを使用して、私たちのアプローチは検出率を +4.1 AP_S または +39% 向上させ、リアルタイム パフォーマンスでは、最先端の小さなオブジェクトに対して +5.3 sAP_S または +63% 向上します (そた)。固定交通カメラの場合、私たちのアプローチは、他の方法ではできない画像スケールで小さなオブジェクトを検出します。同じスケールで、私たちのアプローチは、単純なダウンサンプリングよりも 195% (+12.5 AP_S)、SOTA よりも 63% (+4.2 AP_S) 小さいオブジェクトの検出を改善します。
Real-time efficient perception is critical for autonomous navigation and city scale sensing. Orthogonal to architectural improvements, streaming perception approaches have exploited adaptive sampling improving real-time detection performance. In this work, we propose a learnable geometry-guided prior that incorporates rough geometry of the 3D scene (a ground plane and a plane above) to resample images for efficient object detection. This significantly improves small and far-away object detection performance while also being more efficient both in terms of latency and memory. For autonomous navigation, using the same detector and scale, our approach improves detection rate by +4.1 AP_S or +39% and in real-time performance by +5.3 sAP_S or +63% for small objects over state-of-the-art (SOTA). For fixed traffic cameras, our approach detects small objects at image scales other methods cannot. At the same scale, our approach improves detection of small objects by 195% (+12.5 AP_S) over naive-downsampling and 63% (+4.2 AP_S) over SOTA.
updated: Sat Mar 25 2023 00:43:44 GMT+0000 (UTC)
published: Sat Mar 25 2023 00:43:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト