arXiv reaDer
DSLR:敵対的に訓練されたオートエンコーダーを使用した動的から静的へのLiDARスキャンの再構築
DSLR: Dynamic to Static LiDAR Scan Reconstruction Using Adversarially Trained Autoencoder
動的オブジェクトを含むシーンのLiDARスキャンから静的環境を正確に再構築することは、動的から静的への変換(DST)と呼ばれ、自律ナビゲーションの重要な研究分野です。この問題は最近ビジュアルSLAMで調査されましたが、私たちの知る限り、LiDARスキャンのDSTに対処するための作業は試みられていません。自動運転車にLiDARが広く採用されているため、この問題は非常に重要です。 LiDARスキャンに適合させた場合に視覚領域用に開発された最先端の方法のパフォーマンスが低いことを示します。私たちはDSLRを開発します。これは、敵対的に訓練されたオートエンコーダーを介して動的スキャンと静的スキャンの間のマッピングを学習する深い生成モデルです。私たちのモデルは、明示的なセグメンテーションラベルを使用せずに静的スキャンを生成するLiDAR上のDSTの最初のソリューションを生成します。ペアの動的-静的スキャンがないため、DSLRを常に実世界のデータに適用できるとは限りません。教師なしドメイン適応を使用して、実世界のデータに転送するためのDSLR-UDAを提案し、これが実世界の設定でうまく機能することを実験的に示します。さらに、セグメンテーション情報が利用可能な場合は、DSLRをDSLR-Segに拡張して、再構成の品質をさらに向上させます。 DSLRは、シミュレートされたデータセットと実際のデータセットで最先端のパフォーマンスを提供し、少なくとも4倍の改善を示します。 DSLRは、既存のベースラインとは異なり、動的環境でのSLAMなどの自律ナビゲーションに関連するタスクの許容範囲内で再構築品質を備えた実用的なモデルであることを示します。
Accurate reconstruction of static environments from LiDAR scans of scenes containing dynamic objects, which we refer to as Dynamic to Static Translation (DST), is an important area of research in Autonomous Navigation. This problem has been recently explored for visual SLAM, but to the best of our knowledge no work has been attempted to address DST for LiDAR scans. The problem is of critical importance due to wide-spread adoption of LiDAR in Autonomous Vehicles. We show that state-of the art methods developed for the visual domain when adapted for LiDAR scans perform poorly. We develop DSLR, a deep generative model which learns a mapping between dynamic scan to its static counterpart through an adversarially trained autoencoder. Our model yields the first solution for DST on LiDAR that generates static scans without using explicit segmentation labels. DSLR cannot always be applied to real world data due to lack of paired dynamic-static scans. Using Unsupervised Domain Adaptation, we propose DSLR-UDA for transfer to real world data and experimentally show that this performs well in real world settings. Additionally, if segmentation information is available, we extend DSLR to DSLR-Seg to further improve the reconstruction quality. DSLR gives the state of the art performance on simulated and real-world datasets and also shows at least 4x improvement. We show that DSLR, unlike the existing baselines, is a practically viable model with its reconstruction quality within the tolerable limits for tasks pertaining to autonomous navigation like SLAM in dynamic environments.
updated: Wed May 26 2021 18:19:21 GMT+0000 (UTC)
published: Wed May 26 2021 18:19:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト