駐車誘導システムは、スマートシティ開発パラダイムの一環として、最近人気のトレンドとなっています。このようなシステムの重要な部分は、ドライバーが関心のある地域全体で利用可能な駐車場を検索できるようにするアルゴリズムです。このタスクに対する古典的なアプローチは、カメラ記録へのニューラル ネットワーク分類器の適用に基づいています。しかし、既存のシステムには、一般化能力や特定の視覚条件に関する適切なテストが不足していることが示されています。この研究では、最先端の駐車場占有検出アルゴリズムを広範囲に評価し、その予測品質を最近登場したビジョントランスフォーマーと比較し、EfficientNet アーキテクチャに基づく新しいパイプラインを提案します。実行された計算実験では、5 つの異なるデータセットで評価されたモデルの場合、パフォーマンスの向上が実証されました。
Parking guidance systems have recently become a popular trend as a part of the smart cities' paradigm of development. The crucial part of such systems is the algorithm allowing drivers to search for available parking lots across regions of interest. The classic approach to this task is based on the application of neural network classifiers to camera records. However, existing systems demonstrate a lack of generalization ability and appropriate testing regarding specific visual conditions. In this study, we extensively evaluate state-of-the-art parking lot occupancy detection algorithms, compare their prediction quality with the recently emerged vision transformers, and propose a new pipeline based on EfficientNet architecture. Performed computational experiments have demonstrated the performance increase in the case of our model, which was evaluated on 5 different datasets.