arXiv reaDer
3Dスパース畳み込みニューラルネットワークの補間対応パディング
Interpolation-Aware Padding for 3D Sparse Convolutional Neural Networks
スパースボクセルベースの3D畳み込みニューラルネットワーク(CNN)は、さまざまな3Dビジョンタスクに広く使用されています。スパースボクセルベースの3DCNNは、3D入力からスパースで空でないボクセルを作成し、それらに対してのみ3D畳み込み演算を実行します。シンプルでありながら効果的なパディングスキームを提案します---空でないボクセルに隣接するいくつかの空のボクセルをパディングし、それらを3D CNN計算に含めて、ポイントごとの特徴を計算するときにすべての隣接するボクセルが存在するようにする補間対応パディングトリリニア補間。セマンティックセグメンテーションや3D検出など、ポイントごとの機能が不可欠なきめ細かい3Dビジョンタスクの場合、当社のネットワークは、最近隣内挿法またはゼロパディングまたは八分木を使用した正規化された三線形内挿法を使用して、既存のネットワークよりも高い予測精度を実現します。 -パディングスキーム。さまざまな3Dセグメンテーションおよび検出タスクの広範な比較を通じて、特徴補間と組み合わせたパディングスキームを使用した3DスパースCNNの優位性を示します。
Sparse voxel-based 3D convolutional neural networks (CNNs) are widely used for various 3D vision tasks. Sparse voxel-based 3D CNNs create sparse non-empty voxels from the 3D input and perform 3D convolution operations on them only. We propose a simple yet effective padding scheme --- interpolation-aware padding to pad a few empty voxels adjacent to the non-empty voxels and involve them in the 3D CNN computation so that all neighboring voxels exist when computing point-wise features via the trilinear interpolation. For fine-grained 3D vision tasks where point-wise features are essential, like semantic segmentation and 3D detection, our network achieves higher prediction accuracy than the existing networks using the nearest neighbor interpolation or the normalized trilinear interpolation with the zero-padding or the octree-padding scheme. Through extensive comparisons on various 3D segmentation and detection tasks, we demonstrate the superiority of 3D sparse CNNs with our padding scheme in conjunction with feature interpolation.
updated: Mon Aug 16 2021 07:00:42 GMT+0000 (UTC)
published: Mon Aug 16 2021 07:00:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト