arXiv reaDer
点群ジオメトリ圧縮のためのスパーステンソルベースのマルチスケール表現
Sparse Tensor-based Multiscale Representation for Point Cloud Geometry Compression
この研究では、SparsePCGCと呼ばれるボクセル化されたPCGのスパーステンソルプロセッシング(STP)ベースのマルチスケール表現を介して、統合された点群ジオメトリ(PCG)圧縮方法を開発します。 STPを適用すると、最も可能性の高い正の占有ボクセル(MP-POV)を中心とした畳み込みのみが実行されるため、複雑さが大幅に軽減されます。また、マルチスケール表現により、スケールごとのMP-POVを段階的に圧縮できます。全体的な圧縮効率は、各MP-POVの占有確率の近似精度に大きく依存します。したがって、事前確率を広範囲に活用するために、スパース畳み込みとボクセル再サンプリングで構成されるスパース畳み込みベースのニューラルネットワーク(SparseCNN)を設計します。次に、SparseCNNベースの占有確率近似(SOPA)モデルを開発して、自己回帰近傍を段階的に利用することにより、クロススケールの前または多段階のみを使用して、単一段階の方法で占有確率を推定します。さらに、SparseCNNベースのLocal Neighborhood Embedding(SLNE)を使用して、SOPAを改善するための機能属性としてローカル空間変動を特徴付けることもお勧めします。私たちの統一されたアプローチは、MPEG G-PCCと比較した場合、高密度PCG(8iVFB、Owlii)およびスパースLiDAR PCG(KITTI、Ford)を含むさまざまなデータセットにわたる可逆圧縮モードと非可逆圧縮モードの両方で最先端のパフォーマンスを示しますおよびその他の一般的な学習ベースの圧縮スキーム。さらに、提案された方法は、ポイントごとの計算による軽量の複雑さ、およびすべてのスケールにわたるモデル共有のための小さなストレージの欲求を提示します。再現性のある調査のために、すべての資料をhttps://github.com/NJUVISION/SparsePCGCで公開しています。
This study develops a unified Point Cloud Geometry (PCG) compression method through Sparse Tensor Processing (STP) based multiscale representation of voxelized PCG, dubbed as the SparsePCGC. Applying the STP reduces the complexity significantly because it only performs the convolutions centered at Most-Probable Positively-Occupied Voxels (MP-POV). And the multiscale representation facilitates us to compress scale-wise MP-POVs progressively. The overall compression efficiency highly depends on the approximation accuracy of occupancy probability of each MP-POV. Thus, we design the Sparse Convolution based Neural Networks (SparseCNN) consisting of sparse convolutions and voxel re-sampling to extensively exploit priors. We then develop the SparseCNN based Occupancy Probability Approximation (SOPA) model to estimate the occupancy probability in a single-stage manner only using the cross-scale prior or in multi-stage by step-wisely utilizing autoregressive neighbors. Besides, we also suggest the SparseCNN based Local Neighborhood Embedding (SLNE) to characterize the local spatial variations as the feature attribute to improve the SOPA. Our unified approach shows the state-of-art performance in both lossless and lossy compression modes across a variety of datasets including the dense PCGs (8iVFB, Owlii) and the sparse LiDAR PCGs (KITTI, Ford) when compared with the MPEG G-PCC and other popular learning-based compression schemes. Furthermore, the proposed method presents lightweight complexity due to point-wise computation, and tiny storage desire because of model sharing across all scales. We make all materials publicly accessible at https://github.com/NJUVISION/SparsePCGC for reproducible research.
updated: Sat Nov 20 2021 17:02:45 GMT+0000 (UTC)
published: Sat Nov 20 2021 17:02:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト