Robust Lane Detection via Expanded Self Attention
画像ベースの車線検出アルゴリズムは、自動運転車の重要なテクノロジーの1つです。最新の深層学習手法は、車線検出で高いパフォーマンスを実現しますが、混雑した道路や極端な照明条件などの困難な状況では、車線を正確に検出することは依然として困難です。これらの困難な状況に耐えるためには、限られた視覚的な手がかりからでもグローバルなコンテキスト情報を抽出することが重要です。この論文では、拡張自己注意(ESA)モジュールと呼ばれる、車線検出用に最適化されたシンプルで強力な自己注意メカニズムを提案します。車線の単純な幾何学的構造に触発されて、提案された方法は、画像の垂直方向と水平方向に沿った車線の信頼度を予測します。信頼度の予測により、グローバルなコンテキスト情報を抽出することにより、遮蔽された場所を推定できます。 ESAモジュールは、推論時間を増やすことなく、エンコーダー-デコーダーベースのモデルに簡単に実装および適用できます。私たちの方法のパフォーマンスは、3つの一般的なレーン検出ベンチマーク(TuSimple、CULane、BDD100K)で評価されます。 CULaneとBDD100Kで最先端のパフォーマンスを実現し、TuSimpleデータセットで明確な改善を実現します。実験結果は、私たちのアプローチが閉塞や極端な照明条件に対してロバストであることを示しています。
The image-based lane detection algorithm is one of the key technologies in autonomous vehicles. Modern deep learning methods achieve high performance in lane detection, but it is still difficult to accurately detect lanes in challenging situations such as congested roads and extreme lighting conditions. To be robust on these challenging situations, it is important to extract global contextual information even from limited visual cues. In this paper, we propose a simple but powerful self-attention mechanism optimized for lane detection called the Expanded Self Attention (ESA) module. Inspired by the simple geometric structure of lanes, the proposed method predicts the confidence of a lane along the vertical and horizontal directions in an image. The prediction of the confidence enables estimating occluded locations by extracting global contextual information. ESA module can be easily implemented and applied to any encoder-decoder-based model without increasing the inference time. The performance of our method is evaluated on three popular lane detection benchmarks (TuSimple, CULane and BDD100K). We achieve state-of-the-art performance in CULane and BDD100K and distinct improvement on TuSimple dataset. The experimental results show that our approach is robust to occlusion and extreme lighting conditions.
updated: Tue Oct 26 2021 04:48:53 GMT+0000 (UTC)
published: Sun Feb 14 2021 00:29:55 GMT+0000 (UTC)
