arXiv reaDer
PIN:マルチスケールの心象表現のためのプログレッシブ暗黙的ネットワーク
PINs: Progressive Implicit Networks for Multi-Scale Neural Representations
多層パーセプトロン(MLP)は、一般に位置エンコーディングと呼ばれる、入力の高次元投影と組み合わせると、効果的なシーンエンコーダーであることが証明されています。ただし、周波数スペクトルが広いシーンは依然として課題です。位置エンコーディングに高周波数を選択すると、低構造領域にノイズが発生しますが、低周波数では詳細領域のフィッティングが不十分になります。これに対処するために、階層的なMLP構造を周波数エンコーディングのインクリメンタルセットに公開する、プログレッシブポジショナルエンコーディングを提案します。私たちのモデルは、広い周波数帯域のシーンを正確に再構築し、レベルごとの明示的な監視なしに、プログレッシブレベルの詳細でシーン表現を学習します。アーキテクチャはモジュール式です。各レベルは、それぞれの解像度に個別に活用できる連続的な暗黙の表現をエンコードします。つまり、より粗い再構築のためのより小さなネットワークを意味します。いくつかの2Dおよび3Dデータセットでの実験は、ベースラインと比較して、再構成の精度、表現能力、およびトレーニング速度の改善を示しています。
Multi-layer perceptrons (MLP) have proven to be effective scene encoders when combined with higher-dimensional projections of the input, commonly referred to as positional encoding. However, scenes with a wide frequency spectrum remain a challenge: choosing high frequencies for positional encoding introduces noise in low structure areas, while low frequencies result in poor fitting of detailed regions. To address this, we propose a progressive positional encoding, exposing a hierarchical MLP structure to incremental sets of frequency encodings. Our model accurately reconstructs scenes with wide frequency bands and learns a scene representation at progressive level of detail without explicit per-level supervision. The architecture is modular: each level encodes a continuous implicit representation that can be leveraged separately for its respective resolution, meaning a smaller network for coarser reconstructions. Experiments on several 2D and 3D datasets show improvements in reconstruction accuracy, representational capacity and training speed compared to baselines.
updated: Thu Jun 16 2022 22:12:01 GMT+0000 (UTC)
published: Wed Feb 09 2022 20:33:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト