高度なドライバーアシスタンスと自動運転システムは、危険な状況を予測して回避するためにリスク推定モジュールに依存しています。現在の方法では、高価なセンサー設定と複雑な処理パイプラインを使用しているため、可用性と堅牢性が制限されています。これらの問題に対処するために、単眼カメラで撮影された短いビデオクリップの危険な車線変更行動を分類するための、新しいディープラーニングベースのアクション認識フレームワークを導入します。このタスクの空間的特徴抽出機能として、事前トレーニング済みの最先端のインスタンスセグメンテーションネットワークMask R-CNNを使用する、深時空間分類ネットワークを設計しました。提案手法の長期短期記憶(LSTM)およびより浅い最終分類層は、注釈付きのリスクラベルを使用した半自然的な車線変更データセットでトレーニングされました。最適なネットワークレイアウトとトレーニング戦略を見つけるために、最新の機能抽出ツールの包括的な比較が行われました。 0.937 AUCスコアの最良の結果は、提案されたネットワークで得られました。私たちのコードと訓練されたモデルは、オープンソースで利用可能です。
Advanced driver assistance and automated driving systems rely on risk estimation modules to predict and avoid dangerous situations. Current methods use expensive sensor setups and complex processing pipeline, limiting their availability and robustness. To address these issues, we introduce a novel deep learning based action recognition framework for classifying dangerous lane change behavior in short video clips captured by a monocular camera. We designed a deep spatiotemporal classification network that uses pre-trained state-of-the-art instance segmentation network Mask R-CNN as its spatial feature extractor for this task. The Long-Short Term Memory (LSTM) and shallower final classification layers of the proposed method were trained on a semi-naturalistic lane change dataset with annotated risk labels. A comprehensive comparison of state-of-the-art feature extractors was carried out to find the best network layout and training strategy. The best result, with a 0.937 AUC score, was obtained with the proposed network. Our code and trained models are available open-source.