arXiv reaDer
最適に制御可能な知覚的非可逆圧縮
Optimally Controllable Perceptual Lossy Compression
非可逆圧縮に関する最近の研究では、歪みと知覚の質が互いに対立していることが示されています。これにより、歪みと知覚(DP)のトレードオフがもたらされます。直感的には、さまざまな知覚品質を実現するには、さまざまなデコーダーをトレーニングする必要があります。このホワイトペーパーでは、任意の(無限の数の異なる)DPトレードオフを最適に実現するには、2つのデコーダーだけで十分であるという重要な発見を示します。 DPトレードオフ限界の任意のポイントは、最小MSEデコーダーの出力と特別に構築された完全な知覚デコーダーの間の単純な線形補間によって達成できることを証明します。一方、知覚品質(2乗ワッサースタイン2距離メトリックの観点から)は、内挿係数によって定量的に制御できます。さらに、完全な知覚デコーダーを構築するために、2つの理論的に最適なトレーニングフレームワークを提案します。新しいフレームワークは、既存の方法で広く使用されている歪みと敵対的損失に基づくヒューリスティックフレームワークとは異なります。これは、理論的に最適であるだけでなく、実用的な知覚デコードで最先端のパフォーマンスを実現できます。最後に、理論的な発見を検証し、実験を通じてフレームワークの優位性を実証します。コードはhttps://github.com/ZeyuYan/Controllable-Perceptual-Compressionで入手できます。
Recent studies in lossy compression show that distortion and perceptual quality are at odds with each other, which put forward the tradeoff between distortion and perception (D-P). Intuitively, to attain different perceptual quality, different decoders have to be trained. In this paper, we present a nontrivial finding that only two decoders are sufficient for optimally achieving arbitrary (an infinite number of different) D-P tradeoff. We prove that arbitrary points of the D-P tradeoff bound can be achieved by a simple linear interpolation between the outputs of a minimum MSE decoder and a specifically constructed perfect perceptual decoder. Meanwhile, the perceptual quality (in terms of the squared Wasserstein-2 distance metric) can be quantitatively controlled by the interpolation factor. Furthermore, to construct a perfect perceptual decoder, we propose two theoretically optimal training frameworks. The new frameworks are different from the distortion-plus-adversarial loss based heuristic framework widely used in existing methods, which are not only theoretically optimal but also can yield state-of-the-art performance in practical perceptual decoding. Finally, we validate our theoretical finding and demonstrate the superiority of our frameworks via experiments. Code is available at: https://github.com/ZeyuYan/Controllable-Perceptual-Compression
updated: Tue Jun 21 2022 02:48:35 GMT+0000 (UTC)
published: Tue Jun 21 2022 02:48:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト