arXiv reaDer
単一画像から現実世界のカテゴリ固有の再構成を実現する可変放射輝度フィールド
Variable Radiance Field for Real-Life Category-Specifc Reconstruction from Single Image
単一の画像からカテゴリ固有のオブジェクトを再構成することは、限られた視点からオブジェクトの形状と外観を推測する必要がある困難なタスクです。既存の方法は通常、既知のカメラ固有の再投影に基づく局所特徴の取得に依存していますが、入力画像から離れた視点では速度が遅く、歪みが発生しやすいです。この論文では、既知のカメラ パラメーターを使用せずに単一の画像からカテゴリ固有のオブジェクトを効率的に再構成できる新しいフレームワークである可変放射フィールド (VRF) を紹介します。私たちの主な貢献は次のとおりです。 (1) マルチスケールのグローバル特徴抽出機能を使用して、オブジェクトのジオメトリと外観をパラメータ化します。これにより、頻繁な点単位の特徴取得とカメラ依存が回避されます。また、特徴抽出器を改善するために、対照学習ベースの事前トレーニング戦略も提案します。 (2) カテゴリ テンプレートを学習することでオブジェクトの幾何学的複雑さを軽減し、ハイパーネットワークを使用して小さなニューラル放射フィールドを生成し、高速かつインスタンス固有のレンダリングを実現します。 (3) 学習された類似性変換を使用して、各トレーニング インスタンスをテンプレート空間に調整します。これにより、異なるオブジェクト間で意味的に一貫した学習が可能になります。 CO3D データセットで私たちの手法を評価し、品質と速度の点で既存の手法よりも優れていることを示します。また、形状補間やオブジェクト配置タスクへの適用性も示します。
Reconstructing category-specific objects from a single image is a challenging task that requires inferring the geometry and appearance of an object from a limited viewpoint. Existing methods typically rely on local feature retrieval based on re-projection with known camera intrinsic, which are slow and prone to distortion at viewpoints distant from the input image. In this paper, we present Variable Radiance Field (VRF), a novel framework that can efficiently reconstruct category-specific objects from a single image without known camera parameters. Our key contributions are: (1) We parameterize the geometry and appearance of the object using a multi-scale global feature extractor, which avoids frequent point-wise feature retrieval and camera dependency. We also propose a contrastive learning-based pretraining strategy to improve the feature extractor. (2) We reduce the geometric complexity of the object by learning a category template, and use hypernetworks to generate a small neural radiance field for fast and instance-specific rendering. (3) We align each training instance to the template space using a learned similarity transformation, which enables semantic-consistent learning across different objects. We evaluate our method on the CO3D dataset and show that it outperforms existing methods in terms of quality and speed. We also demonstrate its applicability to shape interpolation and object placement tasks.
updated: Thu Jun 08 2023 12:12:02 GMT+0000 (UTC)
published: Thu Jun 08 2023 12:12:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト