通常、カメラの被写界深度は限られているため、単一のカメラで全焦点画像をキャプチャすることは困難です。全焦点画像を取得する別の方法は、異なる深度で焦点を合わせたいくつかの画像を融合することです。ただし、既存のマルチフォーカス画像融合法では、フォーカス/デフォーカス境界(FDB)の近くの領域について明確な結果を得ることができません。この論文では、特にFDBの近くの領域について、正確にモデル化されたデフォーカススプレッド効果で現実的なトレーニングデータを生成するために、新規のαマット境界デフォーカスモデルを提案します。このαマットデフォーカスモデルと生成されたデータに基づいて、MMF-Netと呼ばれるカスケード境界認識畳み込みネットワークが提案およびトレーニングされ、FDB周りのより明確な融合結果を達成することを目指しています。より具体的には、MMF-Netは、それぞれ初期融合と境界融合のための2つのカスケードサブネットで構成されています。これらの2つのサブネットは、最初にFDBのガイダンスマップを取得し、次にFDB近くの融合を改良するように設計されています。実験では、新しいαマット境界デフォーカスモデルを使用して、提案されたMMF-Netが最先端の方法よりも質的および量的に優れていることを実証しています。
Capturing an all-in-focus image with a single camera is difficult since the depth of field of the camera is usually limited. An alternative method to obtain the all-in-focus image is to fuse several images focusing at different depths. However, existing multi-focus image fusion methods cannot obtain clear results for areas near the focused/defocused boundary (FDB). In this paper, a novel α-matte boundary defocus model is proposed to generate realistic training data with the defocus spread effect precisely modeled, especially for areas near the FDB. Based on this α-matte defocus model and the generated data, a cascaded boundary aware convolutional network termed MMF-Net is proposed and trained, aiming to achieve clearer fusion results around the FDB. More specifically, the MMF-Net consists of two cascaded sub-nets for initial fusion and boundary fusion, respectively; these two sub-nets are designed to first obtain a guidance map of FDB and then refine the fusion near the FDB. Experiments demonstrate that with the help of the new α-matte boundary defocus model, the proposed MMF-Net outperforms the state-of-the-art methods both qualitatively and quantitatively.