arXiv reaDer
SSIMベースのCTUレベルの共同最適ビット割り当てとレート歪み最適化
SSIM-Based CTU-Level Joint Optimal Bit Allocation and Rate Distortion Optimization
 構造的類似性(SSIM)ベースの歪みD_SSIMは、従来の平均二乗誤差D_MSEよりも人間の知覚と一致しています。より良いビデオ品質を達成するために、最適ビット割り当て(OBA)とレート歪み最適化(RDO)に関する多くの研究では、歪みメトリックとしてD_SSIMを使用しました。ただし、それらの多くはSSIMに基づいてOBAとRDOを共同で最適化できなかったため、R-D_SSIMのパフォーマンスが最適化されていませんでした。この問題は、OBAとRDOの両方で均一に使用できる正確なR-D_SSIMモデルがないためです。この問題を解決するために、まずD_SSIM-D_MSEモデルを提案します。このモデルに基づいて、RDOの複雑なR-D_SSIMコストは、新しいSSIM関連のラグランジュ乗数を使用して、より単純なR-D_MSEコストとして計算できます。これにより、SSIMベースのRDOの計算負荷が軽減されるだけでなく、R-D_SSIMモデルをOBAおよびRDOで均一に使用できるようになります。さらに、新しいSSIM関連のラグランジュ乗数を使用すると、R-D_SSIMモデルパラメータを正確に計算できるR-D_SSIM-λ_SSIM(R-D_SSIMの負の導関数)の結合関係を構築できます。正確で統一されたR-D_SSIMモデルにより、SSIMベースのOBAとSSIMベースのRDOは、SOSRと呼ばれる方式で統合されます。 HEVCリファレンスエンコーダーHM16.20と比較すると、SOSRは、同じSSIMの下で4%、10%、および14%のビットレートを、他の状態よりも優れたオールイントラ階層型および非階層型の低遅延B構成で節約します。最新のスキーム。
Structural similarity (SSIM)-based distortion D_SSIM is more consistent with human perception than the traditional mean squared error D_MSE. To achieve better video quality, many studies on optimal bit allocation (OBA) and rate-distortion optimization (RDO) used D_SSIM as the distortion metric. However, many of them failed to optimize OBA and RDO jointly based on SSIM, thus causing a non-optimal R-D_SSIM performance. This problem is due to the lack of an accurate R-D_SSIM model that can be used uniformly in both OBA and RDO. To solve this problem, we propose a D_SSIM-D_MSE model first. Based on this model, the complex R-D_SSIM cost in RDO can be calculated as simpler R-D_MSE cost with a new SSIM-related Lagrange multiplier. This not only reduces the computation burden of SSIM-based RDO, but also enables the R-D_SSIM model to be uniformly used in OBA and RDO. Moreover, with the new SSIM-related Lagrange multiplier in hand, the joint relationship of R-D_SSIM-λ_SSIM (the negative derivative of R-D_SSIM) can be built, based on which the R-D_SSIM model parameters can be calculated accurately. With accurate and unified R-D_SSIM model, SSIM-based OBA and SSIM-based RDO are unified together in our scheme, called SOSR. Compared with the HEVC reference encoder HM16.20, SOSR saves 4%, 10%, and 14% bitrate under the same SSIM in all-intra, hierarchical and non-hierarchical low-delay-B configurations, which is superior to other state-of-the-art schemes.
updated: Sat Apr 03 2021 05:46:29 GMT+0000 (UTC)
published: Tue Apr 28 2020 08:55:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト