本論文では、一般的なマルチモーダル画像復元(MIR)およびマルチモーダル画像融合(MIF)の問題を解決するために、新しいディープ畳み込みニューラルネットワークを提案します。ディープラーニングに基づく他の方法とは異なり、ネットワークアーキテクチャは、新しく提案されたマルチモーダルコンボリューショナルスパースコーディング(MCSC)モデルからインスピレーションを得て設計されています。提案されたネットワークの重要な特徴は、異なるモダリティ間で共有される共通情報を、各単一モダリティに属する一意の情報から自動的に分割できるため、CU-Net、つまり、共通および一意の情報分割ネットワークで示されることです。具体的には、CU-Netは3つのモジュール、つまり、固有の特徴抽出モジュール(UFEM)、共通の特徴保存モジュール(CFPM)、および画像再構成モジュール(IRM)で構成されています。各モジュールのアーキテクチャは、MCSCモデルの対応する部分から派生します。MCSCモデルは、いくつかの学習された畳み込みスパースコーディング(LCSC)ブロックで構成されます。広範な数値結果は、RGBガイド付き深度画像の超解像、フラッシュガイド付き非フラッシュ画像のノイズ除去、マルチフォーカスおよびマルチ露出画像の融合を含む、さまざまなMIRおよびMIFタスクでの本方法の有効性を検証します。
In this paper, we propose a novel deep convolutional neural network to solve the general multi-modal image restoration (MIR) and multi-modal image fusion (MIF) problems. Different from other methods based on deep learning, our network architecture is designed by drawing inspirations from a new proposed multi-modal convolutional sparse coding (MCSC) model. The key feature of the proposed network is that it can automatically split the common information shared among different modalities, from the unique information that belongs to each single modality, and is therefore denoted with CU-Net, i.e., Common and Unique information splitting network. Specifically, the CU-Net is composed of three modules, i.e., the unique feature extraction module (UFEM), common feature preservation module (CFPM), and image reconstruction module (IRM). The architecture of each module is derived from the corresponding part in the MCSC model, which consists of several learned convolutional sparse coding (LCSC) blocks. Extensive numerical results verify the effectiveness of our method on a variety of MIR and MIF tasks, including RGB guided depth image super-resolution, flash guided non-flash image denoising, multi-focus and multi-exposure image fusion.