自動運転車が活発に開発されているこの時代では、運転システムにその決定を説明する能力を提供することが重要になります。この作業では、車両の運転中に高レベルの運転説明を生成することに焦点を当てます。軌道予測モデルの動作を説明する深いアーキテクチャである、Fusionを使用した動作の説明のためにBEEFを紹介します。 BEEFは、人間の運転決定の正当化の注釈によって監視され、複数のレベルから機能を融合することを学習します。マルチモーダルフュージョンの文献における最近の進歩を活用して、BEEFは、高レベルの意思決定機能と中レベルの知覚機能の間の相関関係をモデル化するように注意深く設計されています。私たちのアプローチの柔軟性と効率は、HDDとBDD-Xデータセットでの広範な実験で検証されています。
In this era of active development of autonomous vehicles, it becomes crucial to provide driving systems with the capacity to explain their decisions. In this work, we focus on generating high-level driving explanations as the vehicle drives. We present BEEF, for BEhavior Explanation with Fusion, a deep architecture which explains the behavior of a trajectory prediction model. Supervised by annotations of human driving decisions justifications, BEEF learns to fuse features from multiple levels. Leveraging recent advances in the multi-modal fusion literature, BEEF is carefully designed to model the correlations between high-level decisions features and mid-level perceptual features. The flexibility and efficiency of our approach are validated with extensive experiments on the HDD and BDD-X datasets.