arXiv reaDer
学習した点群ジオメトリ圧縮
Learned Point Cloud Geometry Compression
  この論文では、ディープニューラルネットワーク(DNN)ベースの変分オートエンコーダー(VAE)を使用してポイントクラウドジオメトリ(PCG)を効率的に圧縮するための、新しいエンドツーエンドの学習ポイントクラウドジオメトリ圧縮(別名、学習PCGC)フレームワークを紹介します。このアプローチでは、PCGは最初にボクセル化され、スケーリングされ、重なり合わない3Dキューブに分割されます。その後、コンパクトな潜在機能と超優先生成のために、積み重ねられた3D畳み込みに送られます。ハイパープライアを使用して、潜在フィーチャの条件付き確率モデリングを改善します。重み付きバイナリクロスエントロピー(WBCE)損失がトレーニングに適用され、適応しきい値処理が不要なボクセルを削除して歪みを減らすために推論に使用されます。客観的に、私たちの方法は、少なくとも60%BD-Rate(Bjontegaard Delta Rate)などの大きなパフォーマンスマージンを持つ有名なMoving Picture Experts Group(MPEG)によって標準化されたジオメトリベースのポイントクラウド圧縮(G-PCC)アルゴリズムを超えています。共通のテストデータセットを使用して、利益を得ます。主観的に、私たちの方法は、既存のすべてのMPEG標準準拠のPCC方法と比較して、より滑らかな表面再構成と魅力的な詳細でより良い視覚品質を示しました。この方法では、合計で約2.5MBのパラメーターが必要です。これは、組み込みプラットフォームでも、実用的な実装にはかなり小さいサイズです。追加のアブレーション研究では、さまざまな側面(キューブサイズ、カーネルなど)を分析して、学習したPCGCのアプリケーションの可能性を調査します。
This paper presents a novel end-to-end Learned Point Cloud Geometry Compression (a.k.a., Learned-PCGC) framework, to efficiently compress the point cloud geometry (PCG) using deep neural networks (DNN) based variational autoencoders (VAE). In our approach, PCG is first voxelized, scaled and partitioned into non-overlapped 3D cubes, which is then fed into stacked 3D convolutions for compact latent feature and hyperprior generation. Hyperpriors are used to improve the conditional probability modeling of latent features. A weighted binary cross-entropy (WBCE) loss is applied in training while an adaptive thresholding is used in inference to remove unnecessary voxels and reduce the distortion. Objectively, our method exceeds the geometry-based point cloud compression (G-PCC) algorithm standardized by well-known Moving Picture Experts Group (MPEG) with a significant performance margin, e.g., at least 60% BD-Rate (Bjontegaard Delta Rate) gains, using common test datasets. Subjectively, our method has presented better visual quality with smoother surface reconstruction and appealing details, in comparison to all existing MPEG standard compliant PCC methods. Our method requires about 2.5MB parameters in total, which is a fairly small size for practical implementation, even on embedded platform. Additional ablation studies analyze a variety of aspects (e.g., cube size, kernels, etc) to explore the application potentials of our learned-PCGC.
updated: Thu Sep 26 2019 11:40:50 GMT+0000 (UTC)
published: Thu Sep 26 2019 11:40:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト