arXiv reaDer
テクスチャ合成のための一般化された整流器ウェーブレット共分散モデル
Generalized Rectifier Wavelet Covariance Models For Texture Synthesis
テクスチャ合成の最先端の最大エントロピーモデルは、畳み込みニューラルネットワーク(CNN)によって定義された画像表現に依存する統計から構築されます。このような表現は、テクスチャ画像の豊富な構造をキャプチャし、この点でウェーブレットベースの表現よりも優れています。ただし、ニューラルネットワークとは逆に、ウェーブレットは画像内の複数のスケール(エッジなど)で構造を検出することが知られているため、意味のある表現を提供します。この作業では、一般化された整流器の非線形性を使用して、1層CNNの特定のインスタンスと見なすことができる非線形ウェーブレットベースの表現に基づいて構築された統計のファミリーを提案します。これらの統計は、以前の古典的なウェーブレットベースのモデルの視覚的品質を大幅に改善し、グレースケールとカラーテクスチャの両方で、最先端のモデルと同様の品質の合成を生成できるようにします。
State-of-the-art maximum entropy models for texture synthesis are built from statistics relying on image representations defined by convolutional neural networks (CNN). Such representations capture rich structures in texture images, outperforming wavelet-based representations in this regard. However, conversely to neural networks, wavelets offer meaningful representations, as they are known to detect structures at multiple scales (e.g. edges) in images. In this work, we propose a family of statistics built upon non-linear wavelet based representations, that can be viewed as a particular instance of a one-layer CNN, using a generalized rectifier non-linearity. These statistics significantly improve the visual quality of previous classical wavelet-based models, and allow one to produce syntheses of similar quality to state-of-the-art models, on both gray-scale and color textures.
updated: Mon Mar 14 2022 17:07:40 GMT+0000 (UTC)
published: Mon Mar 14 2022 17:07:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト