このホワイトペーパーでは、複雑なハードウェアシステムがなく、カメラが1台しかない場合に動作する自動運転車(AV)の視覚ベースのローカリゼーション手法を紹介します。視覚的位置特定とは、周囲の視覚情報に基づいてオブジェクトの位置を見つけることを目的とした手法を指します。ローカリゼーションの問題は、長年にわたって関心を集めてきました。ただし、視覚的なローカリゼーションは、輸送の文献では比較的新しい主題です。さらに、自動運転車のコンテキストでこのタイプのローカリゼーションを適用することは避けられないため、交通業界はこの問題に特別な注意を払う必要があります。この研究では、ジオタグ付き画像のデータベースと、車の移動中に写真を撮ることができる車に搭載されたカメラを必要とする2段階のローカリゼーション方法を提案します。画像検索である最初のステップは、SIFTローカル特徴記述子を使用して、画像マッチングを使用して車両の初期位置を見つけます。次のステップは、カルマンフィルターを利用して、移動中の車両のより正確な位置を推定することです。導入されたメソッドのすべての段階は、さまざまなPythonライブラリを使用して完全なシステムとして実装されます。提案されたシステムは、KITTIデータセットでテストされ、車両の最終的な位置を見つける際に2メートルの平均精度を示しました。
This paper introduces a visual-based localization method for autonomous vehicles (AVs) that operate in the absence of any complicated hardware system but a single camera. Visual localization refers to techniques that aim to find the location of an object based on visual information of its surrounding area. The problem of localization has been of interest for many years. However, visual localization is a relatively new subject in the literature of transportation. Moreover, the inevitable application of this type of localization in the context of autonomous vehicles demands special attention from the transportation community to this problem. This study proposes a two-step localization method that requires a database of geotagged images and a camera mounted on a vehicle that can take pictures while the car is moving. The first step which is image retrieval uses SIFT local feature descriptor to find an initial location for the vehicle using image matching. The next step is to utilize the Kalman filter to estimate a more accurate location for the vehicle as it is moving. All stages of the introduced method are implemented as a complete system using different Python libraries. The proposed system is tested on the KITTI dataset and has shown an average accuracy of 2 meters in finding the final location of the vehicle.