arXiv reaDer
多重解像度ハッシュエンコーディングを使用したインスタントニューラルグラフィックスプリミティブ
Instant Neural Graphics Primitives with a Multiresolution Hash Encoding
完全に接続されたニューラルネットワークによってパラメータ化されたニューラルグラフィックスプリミティブは、トレーニングと評価にコストがかかる可能性があります。品質を犠牲にすることなく、より小さなネットワークの使用を可能にする多用途の新しい入力エンコーディングでこのコストを削減し、浮動小数点およびメモリアクセス操作の数を大幅に削減します。小さなニューラルネットワークは、トレーニング可能な特徴ベクトルの多重解像度ハッシュテーブルによって拡張されます。その値は確率的勾配降下法によって最適化されます。多重解像度構造により、ネットワークはハッシュの衝突を明確にすることができ、最新のGPUで並列化するのが簡単なシンプルなアーキテクチャになります。無駄な帯域幅と計算操作を最小限に抑えることに重点を置いて、完全に融合されたCUDAカーネルを使用してシステム全体を実装することにより、この並列処理を活用します。数桁の高速化を組み合わせて実現し、高品質のニューラルグラフィックスプリミティブのトレーニングを数秒で可能にし、1920 \!×\!1080の解像度で数十ミリ秒でレンダリングします。
Neural graphics primitives, parameterized by fully connected neural networks, can be costly to train and evaluate. We reduce this cost with a versatile new input encoding that permits the use of a smaller network without sacrificing quality, thus significantly reducing the number of floating point and memory access operations: a small neural network is augmented by a multiresolution hash table of trainable feature vectors whose values are optimized through stochastic gradient descent. The multiresolution structure allows the network to disambiguate hash collisions, making for a simple architecture that is trivial to parallelize on modern GPUs. We leverage this parallelism by implementing the whole system using fully-fused CUDA kernels with a focus on minimizing wasted bandwidth and compute operations. We achieve a combined speedup of several orders of magnitude, enabling training of high-quality neural graphics primitives in a matter of seconds, and rendering in tens of milliseconds at a resolution of 1920\!×\!1080.
updated: Sun Jan 16 2022 07:22:47 GMT+0000 (UTC)
published: Sun Jan 16 2022 07:22:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト