arXiv reaDer
赤外線と可視画像の融合における明示的および暗黙的なモデル
Explicit and implicit models in infrared and visible image fusion
マルチモーダル画像ペアとしての赤外線画像と可視画像は、同じシーンの表現に大きな違いを示します。画像融合タスクは2つの問題に直面しています。1つは異なるモダリティ間で固有の機能を維持することであり、もう1つはローカルおよびグローバル機能などのさまざまなレベルで機能を維持することです。このホワイトペーパーでは、画像融合における深層学習モデルの制限と、対応する最適化戦略について説明します。人工的に設計された構造と制約に基づいて、モデルを明示的なモデルと、高レベルの機能を適応的に学習する、またはグローバルなピクセルの関連付けを確立できる暗黙的なモデルに分割します。 21のテストセットでの比較実験のための10のモデルがスクリーニングされました。定性的および定量的な結果は、暗黙のモデルが画像の特徴を学習するためのより包括的な能力を持っていることを示しています。同時に、それらの安定性を改善する必要があります。既存のアルゴリズムによって解決される利点と制限を目指して、マルチモーダル画像融合の主な問題と将来の研究の方向性について説明します。
Infrared and visible images, as multi-modal image pairs, show significant differences in the expression of the same scene. The image fusion task is faced with two problems: one is to maintain the unique features between different modalities, and the other is to maintain features at various levels like local and global features. This paper discusses the limitations of deep learning models in image fusion and the corresponding optimization strategies. Based on artificially designed structures and constraints, we divide models into explicit models, and implicit models that adaptively learn high-level features or can establish global pixel associations. Ten models for comparison experiments on 21 test sets were screened. The qualitative and quantitative results show that the implicit models have more comprehensive ability to learn image features. At the same time, the stability of them needs to be improved. Aiming at the advantages and limitations to be solved by existing algorithms, we discuss the main problems of multi-modal image fusion and future research directions.
updated: Mon Jun 20 2022 06:05:09 GMT+0000 (UTC)
published: Mon Jun 20 2022 06:05:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト