arXiv reaDer
Fusion-GRU: 危険運転ビデオにおける交通エージェントの将来の境界ボックスを予測するための深層学習モデル
Fusion-GRU: A Deep Learning Model for Future Bounding Box Prediction of Traffic Agents in Risky Driving Videos
複雑な交通シナリオにおいて自動運転車と高度な運転支援システムの安全かつ効率的なナビゲーションを確保するには、周囲の交通エージェントの将来の境界ボックスを予測することが重要です。しかし、自己中心的な視点からターゲット交通エージェントの将来の位置と規模を同時に予測することは、車両の自己運動によってかなりの視野変化が生じるため、課題が生じます。さらに、異常な状況や危険な状況では、追跡の喪失や突然の動きの変化によって利用可能な観察時間が制限され、短い時間枠内で手がかりを学習する必要があります。既存の方法は通常、単純な連結操作を使用して異なるキューを結合し、時間の経過に伴うダイナミクスを監視します。これに対処するために、この文書では、将来のバウンディング ボックスの位置特定のための新しいエンコーダ/デコーダ アーキテクチャである Fusion-Gated Recurrent Unit (Fusion-GRU) ネットワークを紹介します。従来の GRU とは異なり、Fusion-GRU は入力機能間の相互の複雑な相互作用を考慮します。さらに、長距離予測のための逐次依存関係を学習するために、セルフアテンション集約層と結合された中間推定器も導入されています。最後に、GRU デコーダを使用して、将来の境界ボックスを予測します。提案された方法は、ROL と HEV-I という 2 つの公的に利用可能なデータセットで評価されます。実験結果は、Fusion-GRU の有望なパフォーマンスを示し、トラフィック エージェントの将来の境界ボックスを予測する際のその有効性を示しています。
To ensure the safe and efficient navigation of autonomous vehicles and advanced driving assistance systems in complex traffic scenarios, predicting the future bounding boxes of surrounding traffic agents is crucial. However, simultaneously predicting the future location and scale of target traffic agents from the egocentric view poses challenges due to the vehicle's egomotion causing considerable field-of-view changes. Moreover, in anomalous or risky situations, tracking loss or abrupt motion changes limit the available observation time, requiring learning of cues within a short time window. Existing methods typically use a simple concatenation operation to combine different cues, overlooking their dynamics over time. To address this, this paper introduces the Fusion-Gated Recurrent Unit (Fusion-GRU) network, a novel encoder-decoder architecture for future bounding box localization. Unlike traditional GRUs, Fusion-GRU accounts for mutual and complex interactions among input features. Moreover, an intermediary estimator coupled with a self-attention aggregation layer is also introduced to learn sequential dependencies for long range prediction. Finally, a GRU decoder is employed to predict the future bounding boxes. The proposed method is evaluated on two publicly available datasets, ROL and HEV-I. The experimental results showcase the promising performance of the Fusion-GRU, demonstrating its effectiveness in predicting future bounding boxes of traffic agents.
updated: Sat Aug 12 2023 18:35:59 GMT+0000 (UTC)
published: Sat Aug 12 2023 18:35:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト