arXiv reaDer
Real-time FPGA Design for OMP Targeting 8K Image Reconstruction
過去10年間、ハードウェアに再構築アルゴリズムを実装することは、圧縮センシング(CS)のリアルタイム再構築の分野で大きな注目を集めてきました。 Orthogonal Matching Pursuit(OMP)は、ハードウェア実装で最も広く使用されている再構成アルゴリズムです。これは、OMPが適切な時間コストで高品質の再構成結果を取得するためです。 OMPには、内積(DP)と最小二乗問題(LSP)が含まれます。これらの2つの部分には、多数の除算計算とかなりのベクトルベースの乗算があり、ハードウェアでのリアルタイム再構築の実装が制限されます。 CSの理論では、再構成アルゴリズムに加えて、センシングマトリックスの選択が再構成の品質に影響を与えます。また、ハードウェアアーキテクチャに影響を与えることにより、再構築の効率にも影響を与えます。したがって、OMPのリアルタイムハードウェアアーキテクチャを設計するには、3つの要素を考慮する必要があります。センシングマトリックスの選択、DPおよびLSPの実装。この論文では、スパース性であり、主にゼロベクトルを含むセンシング行列を採用して、OMP再構成を最適化し、再構成効率のボトルネックを解消します。選択したマトリックスの機能に基づいて、DPとLSPは、単純なシフト、追加、および比較手順によって実装されます。この作業は、ザイリンクスVirtex UltraScale + FPGAデバイスに実装されています。 0.25のサンプリングレートで1024の長さのデジタル信号を再構築するには、提案方法のコストは0.818usですが、最先端のコストは238 $ usです。したがって、この作業により、最先端の方法が290倍高速化されます。この作業は、8Kグレー画像を再構成するのに0.026秒かかり、30FPSのリアルタイム再構成を実現します。
During the past decade, implementing reconstruction algorithms on hardware has been at the center of much attention in the field of real-time reconstruction in Compressed Sensing (CS). Orthogonal Matching Pursuit (OMP) is the most widely used reconstruction algorithm on hardware implementation because OMP obtains good quality reconstruction results under a proper time cost. OMP includes Dot Product (DP) and Least Square Problem (LSP). These two parts have numerous division calculations and considerable vector-based multiplications, which limit the implementation of real-time reconstruction on hardware. In the theory of CS, besides the reconstruction algorithm, the choice of sensing matrix affects the quality of reconstruction. It also influences the reconstruction efficiency by affecting the hardware architecture. Thus, designing a real-time hardware architecture of OMP needs to take three factors into consideration. The choice of sensing matrix, the implementation of DP and LSP. In this paper, a sensing matrix, which is sparsity and contains zero vectors mainly, is adopted to optimize the OMP reconstruction to break the bottleneck of reconstruction efficiency. Based on the features of the chosen matrix, the DP and LSP are implemented by simple shift, add and comparing procedures. This work is implemented on the Xilinx Virtex UltraScale+ FPGA device. To reconstruct a digital signal with 1024 length under 0.25 sampling rate, the proposal method costs 0.818us while the state-of-the-art costs 238$us. Thus, this work speedups the state-of-the-art method 290 times. This work costs 0.026s to reconstruct an 8K gray image, which achieves 30FPS real-time reconstruction.
updated: Sun Oct 10 2021 06:08:35 GMT+0000 (UTC)
published: Sun Oct 10 2021 06:08:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト