この論文では、画像の離散ウェーブレット変換の計算のためのいくつかの新しいスキームを紹介します。これらのスキームは、ステップ数を削減し、結果として、並列アーキテクチャでの同期の数を削減できます。追加の有用な特性として、提案されたスキームは算術演算の数も減らすことができます。このスキームは、主にJPEG 2000画像圧縮規格で採用されているCDF 5/3およびCDF 9/7ウェーブレットで実証されています。ただし、提示された方法は一般的であり、任意のウェーブレット変換に適用できます。その結果、最近公開された元の分離可能な形式の4つのバリアまたは分離不可能な方式の3つのバリアと比較して、2-D CDF 5/3変換に必要なメモリバリアは2つだけです。私たちの推論は、ハイエンドグラフィックスカードの徹底的な実験によってサポートされています。
In this paper, we introduce several new schemes for calculation of discrete wavelet transforms of images. These schemes reduce the number of steps and, as a consequence, allow to reduce the number of synchronizations on parallel architectures. As an additional useful property, the proposed schemes can reduce also the number of arithmetic operations. The schemes are primarily demonstrated on CDF 5/3 and CDF 9/7 wavelets employed in JPEG 2000 image compression standard. However, the presented method is general, and it can be applied on any wavelet transform. As a result, our scheme requires only two memory barriers for 2-D CDF 5/3 transform compared to four barriers in the original separable form or three barriers in the non-separable scheme recently published. Our reasoning is supported by exhaustive experiments on high-end graphics cards.