arXiv reaDer
3D点群の深い知覚メトリック
A deep perceptual metric for 3D point clouds
点群は、3Dコンテンツの保存と送信に不可欠です。大量のデータが必要になる可能性があるため、ポイントクラウドの圧縮は実際の使用に不可欠です。最近、ディープニューラルネットワークに基づく点群ジオメトリ圧縮アプローチが検討されています。この論文では、これらのネットワークを訓練するために採用された典型的なボクセルベースの損失関数の知覚品質を予測する能力を評価します。一般的に使用される焦点損失と重み付きバイナリクロスエントロピーは、人間の知覚との相関が不十分であることがわかります。したがって、ICIP2020主観的データセットの既存の損失関数よりも優れた3D点群の知覚損失関数を提案します。さらに、新しい切り捨てられた距離フィールドボクセルグリッド表現を提案し、バイナリ表現と比較して、知覚される視覚品質とより相関する、よりまばらな潜在空間と損失関数につながることを発見しました。ソースコードはhttps://github.com/mauriceqch/2021_pc_perceptual_lossで入手できます。
Point clouds are essential for storage and transmission of 3D content. As they can entail significant volumes of data, point cloud compression is crucial for practical usage. Recently, point cloud geometry compression approaches based on deep neural networks have been explored. In this paper, we evaluate the ability to predict perceptual quality of typical voxel-based loss functions employed to train these networks. We find that the commonly used focal loss and weighted binary cross entropy are poorly correlated with human perception. We thus propose a perceptual loss function for 3D point clouds which outperforms existing loss functions on the ICIP2020 subjective dataset. In addition, we propose a novel truncated distance field voxel grid representation and find that it leads to sparser latent spaces and loss functions that are more correlated with perceived visual quality compared to a binary representation. The source code is available at https://github.com/mauriceqch/2021_pc_perceptual_loss.
updated: Thu Feb 25 2021 13:24:59 GMT+0000 (UTC)
published: Thu Feb 25 2021 13:24:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト