arXiv reaDer
私のドライバー観察モデルは自信過剰ですか?信頼性が高く解釈可能な信頼性推定のための入力ガイド付きキャリブレーションネットワーク
Is my Driver Observation Model Overconfident? Input-guided Calibration Networks for Reliable and Interpretable Confidence Estimates
ドライバー観察モデルが完璧な条件下で展開されることはめったにありません。実際には、照明、カメラの配置、およびタイプは、トレーニング中に存在するものとは異なり、予期しない動作がいつでも発生する可能性があります。ハンドルの後ろにいる人間を観察することは、より直感的な人間と車両の相互作用とより安全な運転につながりますが、正しいドライバーの状態を予測するだけでなく、現実的で解釈可能な信頼性測定を通じて予測品質を決定する認識アルゴリズムが必要です。信頼できる不確実性の見積もりは、信頼を構築するために重要であり、実際の運転システムに活動認識ネットワークを展開するための深刻な障害です。この作業では、最新のドライバー観測モデルの信頼値が実際に正しい結果の確率とどの程度一致しているかを初めて調べ、生のニューラルネットワークベースのアプローチが予測品質を大幅に過大評価する傾向があることを示します。信頼値と実際の不確実性の間のこの不整合を修正するために、2つの戦略を検討します。まず、温度スケーリングを使用して、ドライバーの観察によく使用される2つの活動認識モデルを拡張します。これは、画像分類における信頼性キャリブレーションの既成の方法です。次に、入力ガイダンスを使用したキャリブレーションされた行動認識(CARING)を紹介します。これは、追加のニューラルネットワークを活用して、ビデオ表現に応じた信頼度のスケーリングを学習する新しいアプローチです。 Drive&Actデータセットでの広範な実験は、両方の戦略がモデルの信頼性の品質を大幅に向上させる一方で、CARINGモデルは、元のアーキテクチャとその温度スケーリングの強化の両方を上回り、最良の不確実性の推定につながることを示しています。
Driver observation models are rarely deployed under perfect conditions. In practice, illumination, camera placement and type differ from the ones present during training and unforeseen behaviours may occur at any time. While observing the human behind the steering wheel leads to more intuitive human-vehicle-interaction and safer driving, it requires recognition algorithms which do not only predict the correct driver state, but also determine their prediction quality through realistic and interpretable confidence measures. Reliable uncertainty estimates are crucial for building trust and are a serious obstacle for deploying activity recognition networks in real driving systems. In this work, we for the first time examine how well the confidence values of modern driver observation models indeed match the probability of the correct outcome and show that raw neural network-based approaches tend to significantly overestimate their prediction quality. To correct this misalignment between the confidence values and the actual uncertainty, we consider two strategies. First, we enhance two activity recognition models often used for driver observation with temperature scaling-an off-the-shelf method for confidence calibration in image classification. Then, we introduce Calibrated Action Recognition with Input Guidance (CARING)-a novel approach leveraging an additional neural network to learn scaling the confidences depending on the video representation. Extensive experiments on the Drive&Act dataset demonstrate that both strategies drastically improve the quality of model confidences, while our CARING model out-performs both, the original architectures and their temperature scaling enhancement, leading to best uncertainty estimates.
updated: Sun Apr 10 2022 12:43:58 GMT+0000 (UTC)
published: Sun Apr 10 2022 12:43:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト