arXiv reaDer
ゼロ平均相互相関を使用した組み込み GPU での効率的なステレオ マッチング
Efficient stereo matching on embedded GPUs with zero-means cross correlation
モバイル ステレオ マッチング システムは、自動運転車や自律型ロボットなど、多くのアプリケーションの重要な部分になっています。正確なステレオ マッチング方法は、通常、計算が非常に複雑になります。ただし、モバイル プラットフォームでは、消費電力を低く抑えるために限られたハードウェア リソースしかありません。これにより、モバイル プラットフォームで許容できる処理速度と精度の両方を維持することが困難になります。このトレードオフを解決するために、ここでは、Jetson Tx2 組み込み GPU での、よく知られたゼロ平均正規化相互相関 (ZNCC) マッチング コスト計算アルゴリズムの新しい高速化アプローチを提案します。 ZNCC を高速化するための方法では、ターゲット画像をジグザグにスキャンして、1 つのピクセルの計算をその隣接ピクセルに対して効率的に再利用します。これにより、データ転送量が減少し、オンチップ レジスタの使用率が向上するため、処理速度が向上します。その結果、当社の方法は、従来の画像スキャン方法よりも 2 倍高速であり、最新の NCC 方法よりも 26% 高速です。この手法をドメイン変換 (DT) アルゴリズムと組み合わせることにより、当社のシステムは、Jetson Tx2 GPU で最大視差 128 の 1,280x384 ピクセル画像に対して 32 fps のリアルタイム処理速度を示します。さらに、KITTI での評価結果は、 2015 年のベンチマークは、組み合わせたシステムが、ほぼ同じ処理速度を維持しながら、国勢調査と組み合わせた同じアルゴリズムよりも 7.26% 正確であることを示しています。
Mobile stereo-matching systems have become an important part of many applications, such as automated-driving vehicles and autonomous robots. Accurate stereo-matching methods usually lead to high computational complexity; however, mobile platforms have only limited hardware resources to keep their power consumption low; this makes it difficult to maintain both an acceptable processing speed and accuracy on mobile platforms. To resolve this trade-off, we herein propose a novel acceleration approach for the well-known zero-means normalized cross correlation (ZNCC) matching cost calculation algorithm on a Jetson Tx2 embedded GPU. In our method for accelerating ZNCC, target images are scanned in a zigzag fashion to efficiently reuse one pixel's computation for its neighboring pixels; this reduces the amount of data transmission and increases the utilization of on-chip registers, thus increasing the processing speed. As a result, our method is 2X faster than the traditional image scanning method, and 26% faster than the latest NCC method. By combining this technique with the domain transformation (DT) algorithm, our system show real-time processing speed of 32 fps, on a Jetson Tx2 GPU for 1,280x384 pixel images with a maximum disparity of 128. Additionally, the evaluation results on the KITTI 2015 benchmark show that our combined system is more accurate than the same algorithm combined with census by 7.26%, while maintaining almost the same processing speed.
updated: Thu Dec 01 2022 13:03:38 GMT+0000 (UTC)
published: Thu Dec 01 2022 13:03:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト