Discrete Cosine Transform Network for Guided Depth Map Super-Resolution
ガイド付き深度超解像(GDSR)は、マルチモーダル画像処理の重要なトピックです。これは、同じシーンのHR RGB画像を使用して、次善の条件で収集された低解像度の深度マップから高解像度(HR)深度マップを再構築します。動作メカニズムの解釈、クロスモーダル特徴の抽出、および過剰転送されたRGBテクスチャの課題を解決するために、3つの側面から問題を軽減する新しい離散コサイン変換ネットワーク(DCTNet)を提案します。まず、離散コサイン変換(DCT)モジュールは、DCTを使用してマルチチャネルHR深度機能を再構築し、GDSRの画像ドメインから導出されたチャネルごとの最適化問題を解決します。次に、共有畳み込みカーネルを使用して共通の特徴を抽出し、プライベートカーネルを使用してモダリティ固有の特徴を抽出する半結合特徴抽出モジュールを紹介します。第三に、エッジアテンションメカニズムを使用して、ガイド付きアップサンプリングに役立つ輪郭を強調します。広範な定量的および定性的評価は、DCTNetの有効性を示しています。これは、比較的少数のパラメーターで、以前の最先端の方法を上回っています。コードは公開されます。
Guided depth super-resolution (GDSR) is an essential topic in multi-modal image processing, which reconstructs high-resolution (HR) depth maps from low-resolution ones collected with suboptimal conditions with the help of HR RGB images of the same scene. To solve the challenges in interpreting the working mechanism, extracting cross-modal features and RGB texture over-transferred, we propose a novel Discrete Cosine Transform Network (DCTNet) to alleviate the problems from three aspects. First, the Discrete Cosine Transform (DCT) module reconstructs the multi-channel HR depth features by using DCT to solve the channel-wise optimization problem derived from the image domain for GDSR. Second, we introduce a semi-coupled feature extraction module that uses shared convolutional kernels to extract common features and private kernels to extract modality-specific features. Third, we employ an edge attention mechanism to highlight the contours valuable for guided upsampling. Extensive quantitative and qualitative evaluations demonstrate the effectiveness of our DCTNet, which outperforms previous state-of-the-art methods with a relatively small number of parameters. Code will be publicly available.
updated: Tue Nov 30 2021 12:28:29 GMT+0000 (UTC)
published: Wed Apr 14 2021 17:01:03 GMT+0000 (UTC)
