視覚走行距離法とSLAMメソッドは、拡張現実やロボット工学などの分野でさまざまな用途に使用されます。視覚センサーを慣性測定で補完することにより、追跡の精度と堅牢性が大幅に向上するため、視覚慣性(VI)オドメトリーアプローチの開発に大きな関心が寄せられています。この論文では、VIオドメトリーを評価するためのさまざまなシーンでの多様なシーケンスセットを備えた新しいデータセットであるTUM VIベンチマークを提案します。 20 Hzで1024 x 1024の解像度、高ダイナミックレンジ、フォトメトリックキャリブレーションを備えたカメラ画像を提供します。 IMUは200 Hzで3軸の加速度と角速度を測定しますが、カメラとIMUセンサーはハードウェアで時間同期されます。軌道の評価のために、モーションキャプチャシステムから、カメラとIMUの測定値と正確に位置合わせされたシーケンスの開始時と終了時に高周波(120 Hz)で正確なポーズグラウンドトゥルースを提供します。生データと較正済みデータを含む完全なデータセットが公開されています。また、データセットで最先端のVIオドメトリアプローチを評価します。
Visual odometry and SLAM methods have a large variety of applications in domains such as augmented reality or robotics. Complementing vision sensors with inertial measurements tremendously improves tracking accuracy and robustness, and thus has spawned large interest in the development of visual-inertial (VI) odometry approaches. In this paper, we propose the TUM VI benchmark, a novel dataset with a diverse set of sequences in different scenes for evaluating VI odometry. It provides camera images with 1024x1024 resolution at 20 Hz, high dynamic range and photometric calibration. An IMU measures accelerations and angular velocities on 3 axes at 200 Hz, while the cameras and IMU sensors are time-synchronized in hardware. For trajectory evaluation, we also provide accurate pose ground truth from a motion capture system at high frequency (120 Hz) at the start and end of the sequences which we accurately aligned with the camera and IMU measurements. The full dataset with raw and calibrated data is publicly available. We also evaluate state-of-the-art VI odometry approaches on our dataset.