ゲート付きカメラからの3つの画像をパルスライダー測定に匹敵する深度精度の高解像度深度マップに変換するイメージングフレームワークを提示します。既存のスキャニングLIDARシステムは、角度サンプリングレートが機械的に制限されているため、広い範囲で低い空間分解能を実現し、シーンの理解タスクを密なサンプリングを伴う近距離クラスターに制限します。さらに、現在のパルスLIDARスキャナーは、高コスト、消費電力、大きなフォームファクターに悩まされており、強力な後方散乱があると機能しません。ポイントスキャンから出発し、3つのゲート画像から深度を学習することにより、低コストのCMOSゲートイメージャを少なくとも80mの範囲の高密度カメラに変換できることを実証します。提案されたアーキテクチャは、ゲートスライス全体のセマンティックコンテキストを活用し、密な深さラベルを必要とせずに合成弁別子損失について学習します。 LIDARシステムをスキャンするために提案された代替はリアルタイムであり、後方散乱を処理し、長距離で高密度の深度を提供します。シミュレーションと、北ヨーロッパの4,000kmを超える運転で取得した実際のデータでのアプローチを検証します。データとコードはhttps://github.com/gruberto/Gated2Depthで入手できます。
We present an imaging framework which converts three images from a gated camera into high-resolution depth maps with depth accuracy comparable to pulsed lidar measurements. Existing scanning lidar systems achieve low spatial resolution at large ranges due to mechanically-limited angular sampling rates, restricting scene understanding tasks to close-range clusters with dense sampling. Moreover, today's pulsed lidar scanners suffer from high cost, power consumption, large form-factors, and they fail in the presence of strong backscatter. We depart from point scanning and demonstrate that it is possible to turn a low-cost CMOS gated imager into a dense depth camera with at least 80m range - by learning depth from three gated images. The proposed architecture exploits semantic context across gated slices, and is trained on a synthetic discriminator loss without the need of dense depth labels. The proposed replacement for scanning lidar systems is real-time, handles back-scatter and provides dense depth at long ranges. We validate our approach in simulation and on real-world data acquired over 4,000km driving in northern Europe. Data and code are available at https://github.com/gruberto/Gated2Depth.