BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in Unstructured Driving Environments
構造化されていない交通環境における視覚シーンの理解のための教師なし適応アプローチを提示します。私たちの方法は、車、トラック、二輪車と三輪車、歩行者で構成される密集した不均一な交通を伴う、構造化されていない現実のシナリオ向けに設計されています。 RGB画像またはビデオの各領域のクラスまたはカテゴリを識別できる、教師なしドメイン適応(DA)に基づく新しいセマンティックセグメンテーション手法について説明します。また、精度を向上させるマルチソースDA用の新しいセルフトレーニングアルゴリズム(Alt-Inc)も紹介します。私たちの全体的なアプローチは、深層学習ベースの手法であり、挑戦的なインドの運転データセットで87.18%の精度を達成する教師なしニューラルネットワークで構成されています。私たちの方法は、マークが付いていない道路や、汚れ、識別できない破片、くぼみなどが含まれている可能性のある道路でうまく機能します。私たちのアプローチの重要な側面は、モデルが最初に遭遇したオブジェクトを特定できることです。テストフェーズ。私たちの方法を最先端の方法と比較すると、5.17%〜42.9%の改善が見られます。さらに、構造化されていない運転環境の視覚的シーン理解の改善を定性的に検証するユーザー調査も実施します。
We present an unsupervised adaptation approach for visual scene understanding in unstructured traffic environments. Our method is designed for unstructured real-world scenarios with dense and heterogeneous traffic consisting of cars, trucks, two-and three-wheelers, and pedestrians. We describe a new semantic segmentation technique based on unsupervised domain adaptation (DA), that can identify the class or category of each region in RGB images or videos. We also present a novel self-training algorithm (Alt-Inc) for multi-source DA that improves the accuracy. Our overall approach is a deep learning-based technique and consists of an unsupervised neural network that achieves 87.18% accuracy on the challenging India Driving Dataset. Our method works well on roads that may not be well-marked or may include dirt, unidentifiable debris, potholes, etc. A key aspect of our approach is that it can also identify objects that are encountered by the model for the fist time during the testing phase. We compare our method against the state-of-the-art methods and show an improvement of 5.17% - 42.9%. Furthermore, we also conduct user studies that qualitatively validate the improvements in visual scene understanding of unstructured driving environments.
updated: Sun May 23 2021 15:27:04 GMT+0000 (UTC)
published: Tue Sep 22 2020 08:25:44 GMT+0000 (UTC)
