arXiv reaDer
異常な運転行動を検出するための修正された監視された対照学習
Modified Supervised Contrastive Learning for Detecting Anomalous Driving Behaviours
脇見運転の行動を検出することは、世界中で発生する何百万もの死傷者を減らすために重要です。気が散るまたは異常な運転行動は、ドライバーに警告するために正しく識別される必要がある「通常の」運転からの逸脱です。ただし、これらの運転行動は1つの特定のタイプの運転スタイルで構成されておらず、分類器のトレーニング段階とテスト段階でその分布が異なる場合があります。この問題を教師あり対照学習アプローチとして定式化し、視覚的表現を学習して、正常な、および見られた、または見られない異常な運転行動を検出します。最適化を支援するために、負のペアの類似性を調整するために、標準の対比損失関数に変更を加えました。通常、(自己)教師あり対照フレームワークには、エンコーダーとそれに続く投影ヘッドが含まれます。これは、エンコードレイヤーに一般的な視覚的代表情報が含まれていると見なされるため、テストフェーズでは省略されます。ただし、教師あり対照学習タスクには、プロジェクションヘッドを含むことが有益であると断言します。トップカメラとフロントカメラ(深度と赤外線の両方)からの31人のドライバーの正常および異常な運転行動の783分のビデオ記録を含むドライバー異常検出データセットで結果を示しました。また、このデータセットのラベルを微調整する追加の手順を実行しました。 9つのビデオモダリティの組み合わせのうち、修正された対照的アプローチにより、ベースラインモデルと比較して7のROC AUCが改善されました(さまざまなモダリティで3.12%から8.91%)。残りの2つのモデルにも手動のラベルが付いていました。統計的検定を実行して、変更がベースラインの対照モデルよりも優れていることを示す証拠を示しました。最後に、結果は、上面図と正面図からの深度と赤外線モダリティの融合が、0.9738の最高のAUCROCと0.9772のAUCPRを達成したことを示しました。
Detecting distracted driving behaviours is important to reduce millions of deaths and injuries occurring worldwide. Distracted or anomalous driving behaviours are deviations from the 'normal' driving that need to be identified correctly to alert the driver. However, these driving behaviours do not comprise of one specific type of driving style and their distribution can be different during training and testing phases of a classifier. We formulate this problem as a supervised contrastive learning approach to learn a visual representation to detect normal, and seen and unseen anomalous driving behaviours. We made a change to the standard contrastive loss function to adjust the similarity of negative pairs to aid the optimization. Normally, the (self) supervised contrastive framework contains an encoder followed by a projection head, which is omitted during testing phase as the encoding layers are considered to contain general visual representative information. However, we assert that for supervised contrastive learning task, including projection head will be beneficial. We showed our results on a Driver Anomaly Detection dataset that contains 783 minutes of video recordings of normal and anomalous driving behaviours of 31 drivers from various from top and front cameras (both depth and infrared). We also performed an extra step of fine tuning the labels in this dataset. Out of 9 video modalities combinations, our modified contrastive approach improved the ROC AUC on 7 in comparison to the baseline models (from 3.12% to 8.91% for different modalities); the remaining two models also had manual labelling. We performed statistical tests that showed evidence that our modifications perform better than the baseline contrastive models. Finally, the results showed that the fusion of depth and infrared modalities from top and front view achieved the best AUC ROC of 0.9738 and AUC PR of 0.9772.
updated: Thu Sep 09 2021 03:50:19 GMT+0000 (UTC)
published: Thu Sep 09 2021 03:50:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト