複雑な道路交通シーンでは、歩行者や自転車の違法な車線侵入が、自動運転アプリケーションにおける主要な安全上の課題の1つを構成します。本論文では、移動車両に固定された単眼カメラを介して150m先で発生する車線侵入行動を認識することを目的とした、モーション時系列分類のための新しいオブジェクトレベル位相空間再構成ネットワーク(PSRNet)を提案します。 PSRNetでは、歩行者とサイクリストの動きは、特に観察可能なオブジェクトレベルの動的プロセスと見なされ、潜在的な位相空間内の状態ベクトルの軌跡として再構築でき、さらに、学習可能なリアプノフ指数のような分類器によって特徴付けられます。状態軌道の平均指数発散の項。さらに、最初にビデオ入力を各オブジェクトの1次元モーション時系列に変換するために、検出による視覚オブジェクトの追跡に基づく車線幅の正規化が提示されます。実際の都市道路から収集されたTHU-IntrudBehaviorデータセットに対して広範な実験が行われます。結果は、PSRNetが98.0%の最高精度に達する可能性があることを示しています。これは、既存の行動認識アプローチを30%以上大幅に上回っています。
In a complex road traffic scene, illegal lane intrusion of pedestrians or cyclists constitutes one of the main safety challenges in autonomous driving application. In this paper, we propose a novel object-level phase space reconstruction network (PSRNet) for motion time series classification, aiming to recognize lane intrusion actions that occur 150m ahead through a monocular camera fixed on moving vehicle. In the PSRNet, the movement of pedestrians and cyclists, specifically viewed as an observable object-level dynamic process, can be reconstructed as trajectories of state vectors in a latent phase space and further characterized by a learnable Lyapunov exponent-like classifier that indicates discrimination in terms of average exponential divergence of state trajectories. Additionally, in order to first transform video inputs into one-dimensional motion time series of each object, a lane width normalization based on visual object tracking-by-detection is presented. Extensive experiments are conducted on the THU-IntrudBehavior dataset collected from real urban roads. The results show that our PSRNet could reach the best accuracy of 98.0%, which remarkably exceeds existing action recognition approaches by more than 30%.