arXiv reaDer
地域固有のマルチスケール特徴抽出を使用したCNNベースの2段階駐車場スロット検出
CNN-based Two-Stage Parking Slot Detection Using Region-Specific Multi-Scale Feature Extraction
自律駐車システムは、利用可能な駐車スロットの検出から始まります。駐車場の検出性能は、深層学習技術によって劇的に改善されました。深層学習ベースのオブジェクト検出方法は、1段階と2段階のアプローチに分類できます。一般的な物体検出では、2段階のアプローチが1段階のアプローチよりも優れていることはよく知られていますが、これまでのところ、駐車場の検出でも同様に機能しています。これは、2段階のアプローチがまだ駐車場の検出に十分に特化されていないためだと考えられます。したがって、この論文は、地域固有のマルチスケール特徴抽出を使用する高度に専門化された2ステージパーキングスロット検出器を提案します。最初の段階では、提案された方法は、駐車スロットの中心、長さ、および方向を推定することによって、領域提案として駐車スロットの入口を見つけます。この方法の第2段階では、必要な情報を最も多く含む特定の領域を指定し、それらから特徴を抽出します。つまり、位置と方向の特徴は、位置と方向の情報を最も多く含む特定の領域からのみ個別に抽出されます。さらに、多重解像度の特徴マップを利用して、測位と分類の両方の精度を高めます。高解像度のフィーチャマップを使用して詳細情報(場所と方向)を抽出し、別の低解像度のフィーチャマップを使用してセマンティック情報(タイプと占有率)を抽出します。実験では、提案された方法は、2つの大規模な公共駐車場スロット検出データセットを使用して定量的に評価され、1段階と2段階の両方のアプローチを含む以前の方法を上回りました。
Autonomous parking systems start with the detection of available parking slots. Parking slot detection performance has been dramatically improved by deep learning techniques. Deep learning-based object detection methods can be categorized into one-stage and two-stage approaches. Although it is well-known that the two-stage approach outperforms the one-stage approach in general object detection, they have performed similarly in parking slot detection so far. We consider this is because the two-stage approach has not yet been adequately specialized for parking slot detection. Thus, this paper proposes a highly specialized two-stage parking slot detector that uses region-specific multi-scale feature extraction. In the first stage, the proposed method finds the entrance of the parking slot as a region proposal by estimating its center, length, and orientation. The second stage of this method designates specific regions that most contain the desired information and extracts features from them. That is, features for the location and orientation are separately extracted from only the specific regions that most contain the locational and orientational information. In addition, multi-resolution feature maps are utilized to increase both positioning and classification accuracies. A high-resolution feature map is used to extract detailed information (location and orientation), while another low-resolution feature map is used to extract semantic information (type and occupancy). In experiments, the proposed method was quantitatively evaluated with two large-scale public parking slot detection datasets and outperformed previous methods, including both one-stage and two-stage approaches.
updated: Fri Aug 13 2021 12:02:02 GMT+0000 (UTC)
published: Fri Aug 13 2021 12:02:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト