arXiv reaDer
ReS2tAC-組み込みARMおよびCUDAデバイス用に最適化されたUAV搭載のリアルタイムSGMステレオ
ReS2tAC -- UAV-Borne Real-Time SGM Stereo Optimized for Embedded ARM and CUDA Devices
無人航空機などの低コストのロボットシステムの出現により、埋め込まれた高性能画像処理の重要性が増しています。長い間、FPGAは、組み込みシステムに不可欠な低消費電力を維持しながら、高性能コンピューティングが可能な唯一の処理ハードウェアでした。ただし、ARMCPUとNVIDIATegraGPUで構成されるNVIDIAJetsonシリーズなどの組み込みGPUベースのシステムの最近の可用性の向上により、グラフィックスハードウェアでの大規模な並列組み込みコンピューティングが可能になります。これを念頭に置いて、ARMおよびCUDA対応デバイスでのリアルタイムの組み込みステレオ処理のアプローチを提案します。これは、広く使用されているセミグローバルマッチングアルゴリズムに基づいています。ここでは、大規模並列コンピューティングを使用することにより、組み込みCUDA GPUのアルゴリズムの最適化を提案します。また、NEON組み込み関数を使用して、組み込みARMCPUでのベクトル化SIMD処理のアルゴリズムを最適化します。 2つのパブリックステレオベンチマークデータセットでさまざまな構成を使用してアプローチを評価し、3.3%という低いエラー率に達する可能性があることを示しました。さらに、私たちの実験は、私たちのアプローチの最速の構成がVGA画像解像度で最大46FPSに達することを示しています。最後に、ユースケース固有の定性的評価で、アプローチの消費電力を評価し、DJI Matrix 210v2 RTK無人航空機(UAV)に接続されたDJI Manifold 2-Gに展開し、実際のUAVに搭載された時間ステレオ処理。
With the emergence of low-cost robotic systems, such as unmanned aerial vehicle, the importance of embedded high-performance image processing has increased. For a long time, FPGAs were the only processing hardware that were capable of high-performance computing, while at the same time preserving a low power consumption, essential for embedded systems. However, the recently increasing availability of embedded GPU-based systems, such as the NVIDIA Jetson series, comprised of an ARM CPU and a NVIDIA Tegra GPU, allows for massively parallel embedded computing on graphics hardware. With this in mind, we propose an approach for real-time embedded stereo processing on ARM and CUDA-enabled devices, which is based on the popular and widely used Semi-Global Matching algorithm. In this, we propose an optimization of the algorithm for embedded CUDA GPUs, by using massively parallel computing, as well as using the NEON intrinsics to optimize the algorithm for vectorized SIMD processing on embedded ARM CPUs. We have evaluated our approach with different configurations on two public stereo benchmark datasets to demonstrate that they can reach an error rate as low as 3.3%. Furthermore, our experiments show that the fastest configuration of our approach reaches up to 46 FPS on VGA image resolution. Finally, in a use-case specific qualitative evaluation, we have evaluated the power consumption of our approach and deployed it on the DJI Manifold 2-G attached to a DJI Matrix 210v2 RTK unmanned aerial vehicle (UAV), demonstrating its suitability for real-time stereo processing onboard a UAV.
updated: Tue Jun 15 2021 07:29:25 GMT+0000 (UTC)
published: Tue Jun 15 2021 07:29:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト