3D形状記述としての符号付き距離関数(SDF)は、レンダリングと再構築のために3Dジオメトリを表すための最も効果的なアプローチの1つです。私たちの仕事は、シェルの等値面として3D形状を学習および分析する最先端の方法DeepSDFに触発されており、この方法は、特に3D形状の再構築と圧縮の領域で有望な結果を示しています。この論文では、ニューラルネットワークと単一の潜在コードでSDFを近似するDeepSDFモデルの容量減少に起因する再構成の縮退問題について考察します。完全な3D形状のローカル形状ジオメトリから学習することにより、元のDeepSDFの結果を改善するモデルであるローカルジオメトリコード学習(LGCL)を提案します。グラフニューラルネットワークを追加して、単一の送信可能な潜在コードを3D形状に分散されたローカル潜在コードのセットに分割します。言及された潜在コードは、ローカル領域でSDFを近似するために使用されます。これにより、元のDeepSDFと比較して近似の複雑さが軽減されます。さらに、これらのローカル潜在コードのトレーニングを容易にするために、新しい幾何学的損失関数を導入します。他の局所的な形状調整方法は3Dボクセル表現を使用することに注意してください。これは、解決が非常に難しい問題であるか、解決できない場合さえあります。対照的に、私たちのアーキテクチャは暗黙的にグラフ処理に基づいており、潜在的なコード空間で直接学習回帰プロセスを実行するため、提案されたアーキテクチャはより柔軟になり、実現も簡単になります。 3D形状再構成に関する実験は、LGCLメソッドがSDFデコーダーのサイズを大幅に小さくして詳細を保持でき、最も重要な定量的メトリックの下で元のDeepSDFメソッドを大幅に上回っていることを示しています。
A signed distance function (SDF) as the 3D shape description is one of the most effective approaches to represent 3D geometry for rendering and reconstruction. Our work is inspired by the state-of-the-art method DeepSDF that learns and analyzes the 3D shape as the iso-surface of its shell and this method has shown promising results especially in the 3D shape reconstruction and compression domain. In this paper, we consider the degeneration problem of reconstruction coming from the capacity decrease of the DeepSDF model, which approximates the SDF with a neural network and a single latent code. We propose Local Geometry Code Learning (LGCL), a model that improves the original DeepSDF results by learning from a local shape geometry of the full 3D shape. We add an extra graph neural network to split the single transmittable latent code into a set of local latent codes distributed on the 3D shape. Mentioned latent codes are used to approximate the SDF in their local regions, which will alleviate the complexity of the approximation compared to the original DeepSDF. Furthermore, we introduce a new geometric loss function to facilitate the training of these local latent codes. Note that other local shape adjusting methods use the 3D voxel representation, which in turn is a problem highly difficult to solve or even is insolvable. In contrast, our architecture is based on graph processing implicitly and performs the learning regression process directly in the latent code space, thus make the proposed architecture more flexible and also simple for realization. Our experiments on 3D shape reconstruction demonstrate that our LGCL method can keep more details with a significantly smaller size of the SDF decoder and outperforms considerably the original DeepSDF method under the most important quantitative metrics.