自動運転車(AV)の安全性には、環境の認識が不可欠です。ほとんどの既存のAV知覚アルゴリズムは、周囲の環境の複雑さを研究しておらず、環境の複雑さのパラメーターを含めることができませんでした。この論文は、周囲の運転環境の複雑さのレベルを予測するための新しい注意ベースのニューラルネットワークモデルを提案します。提案されたモデルは、自然主義的な運転ビデオと対応する車両ダイナミクスパラメータを入力として受け取ります。これは、Yolo-v3オブジェクト検出アルゴリズム、ヒートマップ生成アルゴリズム、CNNベースの特徴抽出器、および特徴を抽出するためのビデオと時系列の両方のビークルダイナミクスデータ入力用の注意ベースの特徴抽出器で構成されます。提案されたアルゴリズムからの出力は、周囲の環境の複雑さのパラメーターです。 Berkeley DeepDriveデータセット(BDDデータセット)と主観的にラベル付けされた周囲の環境の複雑さのレベルは、アルゴリズムを評価するためのモデルのトレーニングと検証に使用されます。提案された注意ベースのネットワークは、周囲の環境の複雑さを分類するために91.22%の平均分類精度を達成します。これは、環境の複雑さのレベルを正確に予測し、将来のAVの環境認識研究に適用できることを証明しています。
Environment perception is crucial for autonomous vehicle (AV) safety. Most existing AV perception algorithms have not studied the surrounding environment complexity and failed to include the environment complexity parameter. This paper proposes a novel attention-based neural network model to predict the complexity level of the surrounding driving environment. The proposed model takes naturalistic driving videos and corresponding vehicle dynamics parameters as input. It consists of a Yolo-v3 object detection algorithm, a heat map generation algorithm, CNN-based feature extractors, and attention-based feature extractors for both video and time-series vehicle dynamics data inputs to extract features. The output from the proposed algorithm is a surrounding environment complexity parameter. The Berkeley DeepDrive dataset (BDD Dataset) and subjectively labeled surrounding environment complexity levels are used for model training and validation to evaluate the algorithm. The proposed attention-based network achieves 91.22% average classification accuracy to classify the surrounding environment complexity. It proves that the environment complexity level can be accurately predicted and applied for future AVs' environment perception studies.