arXiv reaDer
PCNet: マルチスペクトルおよびマルチモーダル画像レジストレーションのための構造類似性強化方法
PCNet: A Structure Similarity Enhancement Method for Multispectral and Multimodal Image Registration
マルチスペクトルおよびマルチモーダルの画像処理は、コンピューター ビジョンと計算写真のコミュニティで重要です。取得したマルチスペクトルおよびマルチモーダル データは、通常、画像デバイスの変更または移動により位置がずれているため、画像登録手順が必要です。マルチスペクトルまたはマルチモーダル画像の登録は、非線形強度と勾配変化のために困難です。この課題に対処するために、構造の類似性を高め、非線形の強度と勾配の変化を軽減できる位相一致ネットワーク (PCNet) を提案します。次に、ネットワークによって生成された類似性が強化された特徴を使用して、画像を整列させることができます。 PCNet は、位相一致事前のガイダンスの下で構築されます。ネットワークには、位相一致理論に従って変更された学習可能な Gabor カーネルを伴う 3 つの訓練可能な層が含まれています。事前知識のおかげで、PCNet は非常に軽量であり、非常に少量のマルチスペクトル データでトレーニングできます。 PCNet は完全に畳み込みであると見なすことができるため、任意のサイズの入力を受け取ることができます。トレーニングが完了すると、PCNet は、追加のチューニングを行わなくても、RGB/NIR やフラッシュ/フラッシュなしの画像など、さまざまなマルチスペクトルおよびマルチモーダル データに適用できます。実験結果は、PCNet が、PCNet と比較して数百倍のパラメータを持つ深層学習ベースのものを含む、現在の最先端の登録アルゴリズムよりも優れていることを検証します。類似性強化トレーニングのおかげで、PCNet は、特徴チャネルが 3 分の 2 少ない元の位相一致アルゴリズムよりも優れています。
Multispectral and multimodal image processing is important in the community of computer vision and computational photography. As the acquired multispectral and multimodal data are generally misaligned due to the alternation or movement of the image device, the image registration procedure is necessary. The registration of multispectral or multimodal image is challenging due to the non-linear intensity and gradient variation. To cope with this challenge, we propose the phase congruency network (PCNet), which is able to enhance the structure similarity and alleviate the non-linear intensity and gradient variation. The images can then be aligned using the similarity enhanced features produced by the network. PCNet is constructed under the guidance of the phase congruency prior. The network contains three trainable layers accompany with the modified learnable Gabor kernels according to the phase congruency theory. Thanks to the prior knowledge, PCNet is extremely light-weight and can be trained on quite a small amount of multispectral data. PCNet can be viewed to be fully convolutional and hence can take input of arbitrary sizes. Once trained, PCNet is applicable on a variety of multispectral and multimodal data such as RGB/NIR and flash/no-flash images without additional further tuning. Experimental results validate that PCNet outperforms current state-of-the-art registration algorithms, including the deep-learning based ones that have the number of parameters hundreds times compared to PCNet. Thanks to the similarity enhancement training, PCNet outperforms the original phase congruency algorithm with two-thirds less feature channels.
updated: Wed Jun 09 2021 15:00:51 GMT+0000 (UTC)
published: Wed Jun 09 2021 15:00:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト