arXiv reaDer
大規模で多様なデータセットの多項式の暗黙的なニューラル表現
Polynomial Implicit Neural Representations For Large Diverse Datasets
暗黙的ニューラル表現 (INR) は、超解像、3D モデリングなど、多くの最終タスクの信号および画像表現で非常に人気があります。ほとんどの INR アーキテクチャは、データ内の高周波情報を説明する正弦波位置エンコーディングに依存しています。ただし、エンコーディング サイズが有限であるため、モデルの表現力が制限されます。単一の特定の画像を表すことから、大規模で多様なデータセットを表すことへと移行するには、より高い表現力が必要です。私たちのアプローチは、画像を多項式関数で表現することでこのギャップに対処し、位置エンコーディングの必要性を排除します。したがって、次第に高度な多項式表現を実現するために、すべての ReLU レイヤーの後で、特徴とアフィン変換された座標位置の間で要素単位の乗算を使用します。提案された方法は、ImageNet のような大規模なデータセットで定性的および定量的に評価されます。提案された Poly-INR モデルは、畳み込み、正規化、または自己注意層がなく、トレーニング可能なパラメーターがはるかに少ない、最先端の生成モデルと同等のパフォーマンスを発揮します。トレーニング パラメーターがはるかに少なく、代表力が高いため、私たちのアプローチは、複雑なドメインでの生成モデリング タスクに INR モデルをより広く採用する道を開きます。コードは https://github.com/Rajhans0/Poly_INR で入手できます。
Implicit neural representations (INR) have gained significant popularity for signal and image representation for many end-tasks, such as superresolution, 3D modeling, and more. Most INR architectures rely on sinusoidal positional encoding, which accounts for high-frequency information in data. However, the finite encoding size restricts the model's representational power. Higher representational power is needed to go from representing a single given image to representing large and diverse datasets. Our approach addresses this gap by representing an image with a polynomial function and eliminates the need for positional encodings. Therefore, to achieve a progressively higher degree of polynomial representation, we use element-wise multiplications between features and affine-transformed coordinate locations after every ReLU layer. The proposed method is evaluated qualitatively and quantitatively on large datasets like ImageNet. The proposed Poly-INR model performs comparably to state-of-the-art generative models without any convolution, normalization, or self-attention layers, and with far fewer trainable parameters. With much fewer training parameters and higher representative power, our approach paves the way for broader adoption of INR models for generative modeling tasks in complex domains. The code is available at https://github.com/Rajhans0/Poly_INR
updated: Mon Mar 20 2023 20:09:46 GMT+0000 (UTC)
published: Mon Mar 20 2023 20:09:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト