arXiv reaDer
交通事故を早期に予測するための動的な時空間アテンションネットワーク
A Dynamic Spatial-temporal Attention Network for Early Anticipation of Traffic Accidents
最近、自動運転車や先進運転支援システム(ADAS)を搭載した車両が登場しています。彼らは完全に人間の運転手によって操作される通常のものと道を共有します。乗客やその他の道路利用者の安全を確保するためには、自動運転車やADASが自然の運転シーンからの交通事故を予測することが不可欠になります。交通エージェントの動的な時空間相互作用は複雑であり、将来の事故を予測するための視覚的な手がかりがドライブレコーダーのビデオデータに深く埋め込まれています。したがって、交通事故の早期予測は依然として課題です。この目的のために、この論文は、ドライブレコーダーのビデオから交通事故を早期に予測するための動的な時空間的注意(DSTA)ネットワークを提示します。提案されたDSTAネットワークは、Dynamic Temporal Attention(DTA)という名前のモジュールを使用して、ビデオシーケンスの識別可能な時間セグメントを選択することを学習します。また、Dynamic Spatial Attention(DSA)という名前の別のモジュールを使用して、フレームの有益な空間領域に焦点を当てることも学習します。事故の時空間関係の特徴は、シーンの外観の特徴とともに、ゲート付き回帰ユニット(GRU)ネットワークと共同で学習されます。 2つのベンチマークデータセットでのDSTAネットワークの実験的評価により、DSTAネットワークが最先端のパフォーマンスを超えていることが確認されました。徹底的なアブレーション研究は、DSTAネットワークの個々のコンポーネントの寄与を評価し、ネットワークがそのようなパフォーマンスをどのように達成するかを明らかにします。さらに、この論文では、2つの補完的なモデルからの予測スコアを融合し、早期の事故予測のパフォーマンスをさらに高める効果を検証する新しい戦略を提案します。
Recently, autonomous vehicles and those equipped with an Advanced Driver Assistance System (ADAS) are emerging. They share the road with regular ones operated by human drivers entirely. To ensure guaranteed safety for passengers and other road users, it becomes essential for autonomous vehicles and ADAS to anticipate traffic accidents from natural driving scenes. The dynamic spatial-temporal interaction of the traffic agents is complex, and visual cues for predicting a future accident are embedded deeply in dashcam video data. Therefore, early anticipation of traffic accidents remains a challenge. To this end, the paper presents a dynamic spatial-temporal attention (DSTA) network for early anticipation of traffic accidents from dashcam videos. The proposed DSTA-network learns to select discriminative temporal segments of a video sequence with a module named Dynamic Temporal Attention (DTA). It also learns to focus on the informative spatial regions of frames with another module named Dynamic Spatial Attention (DSA). The spatial-temporal relational features of accidents, along with scene appearance features, are learned jointly with a Gated Recurrent Unit (GRU) network. The experimental evaluation of the DSTA-network on two benchmark datasets confirms that it has exceeded the state-of-the-art performance. A thorough ablation study evaluates the contributions of individual components of the DSTA-network, revealing how the network achieves such performance. Furthermore, this paper proposes a new strategy that fuses the prediction scores from two complementary models and verifies its effectiveness in further boosting the performance of early accident anticipation.
updated: Fri Jun 18 2021 15:58:53 GMT+0000 (UTC)
published: Fri Jun 18 2021 15:58:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト