可視画像は、動きの推定に広く使用されています。対照的に、熱画像は、通常、解像度が低く、テクスチャが少なく、ノイズが多いため、モーション推定での使用がより困難です。この論文では、マルチスペクトル運動推定システムの性能を評価するための新しいデータセットが提示されます。すべてのシーケンスは、ハンドヘルドマルチスペクトルデバイスから記録されます。これは、標準の可視光カメラ、長波赤外線カメラ、RGB-Dカメラ、および慣性測定装置(IMU)で構成されています。フルセンサー解像度(640 x 480)のカラー画像と熱画像の両方を含むマルチスペクトル画像は、ハードウェア同期を備えた32Hzの標準および長波赤外線カメラから取得されます。深度画像はMicrosoftKinect2によってキャプチャされ、クロスモダリティステレオマッチングの学習に役立ちます。軌道評価のために、モーションキャプチャシステムから取得した正確なグラウンドトゥルースカメラポーズが提供されます。明るい照明のシーケンスに加えて、データセットには、薄暗い、変化する、複雑な照明シーンも含まれています。生データと詳細なデータ形式仕様を含むキャリブレーションデータを含む完全なデータセットは、公開されています。
Visible images have been widely used for motion estimation. Thermal images, in contrast, are more challenging to be used in motion estimation since they typically have lower resolution, less texture, and more noise. In this paper, a novel dataset for evaluating the performance of multi-spectral motion estimation systems is presented. All the sequences are recorded from a handheld multi-spectral device. It consists of a standard visible-light camera, a long-wave infrared camera, an RGB-D camera, and an inertial measurement unit (IMU). The multi-spectral images, including both color and thermal images in full sensor resolution (640 x 480), are obtained from a standard and a long-wave infrared camera at 32Hz with hardware-synchronization. The depth images are captured by a Microsoft Kinect2 and can have benefits for learning cross-modalities stereo matching. For trajectory evaluation, accurate ground-truth camera poses obtained from a motion capture system are provided. In addition to the sequences with bright illumination, the dataset also contains dim, varying, and complex illumination scenes. The full dataset, including raw data and calibration data with detailed data format specifications, is publicly available.