画像のかすみ除去は、画像から大気の霧やかすみを除去することを目的としています。かすみ除去モデルは近年大きく進化していますが、高解像度のかすみ画像の問題に正確に取り組んでいるモデルはほとんどありません。この種の画像の場合、モデルは、画像の縮小バージョンまたはトリミングされたパッチで機能する必要があります。どちらの場合も、精度は低下します。これは主に、画像サイズが大きくなったときにグローバル フィーチャとローカル フィーチャを結合できないという固有の障害によるものです。かすみ除去モデルでは、一般的なシーンの特性を理解するためにグローバル機能が必要であり、細かいピクセルの詳細をより適切に処理するにはローカル機能が必要です。この研究では、これらの問題を解決し、かすみ除去モデルの高解像度画像への適用を最適化するために、Streamlined Global and Local Features Combinator (SGLC) を提案します。 SGLC には 2 つの連続したブロックが含まれています。 1 つ目は、グローバル フィーチャ ジェネレーター (GFG) で、強力なグローバル フィーチャを含む Dehazed イメージの最初のバージョンを生成します。 2 番目のブロックは、以前に生成された画像内のローカル機能の詳細を改善する Local Features Enhancer (LFE) です。 Dehazing の Uformer アーキテクチャでテストしたところ、SGLC は PSNR メトリックを大幅に増加させました。高解像度入力データの効率を向上させるために、他のモデルを SGLC プロセス内に組み込むことができます。
Image Dehazing aims to remove atmospheric fog or haze from an image. Although the Dehazing models have evolved a lot in recent years, few have precisely tackled the problem of High-Resolution hazy images. For this kind of image, the model needs to work on a downscaled version of the image or on cropped patches from it. In both cases, the accuracy will drop. This is primarily due to the inherent failure to combine global and local features when the image size increases. The Dehazing model requires global features to understand the general scene peculiarities and the local features to work better with fine and pixel details. In this study, we propose the Streamlined Global and Local Features Combinator (SGLC) to solve these issues and to optimize the application of any Dehazing model to High-Resolution images. The SGLC contains two successive blocks. The first is the Global Features Generator (GFG) which generates the first version of the Dehazed image containing strong global features. The second block is the Local Features Enhancer (LFE) which improves the local feature details inside the previously generated image. When tested on the Uformer architecture for Dehazing, SGLC increased the PSNR metric by a significant margin. Any other model can be incorporated inside the SGLC process to improve its efficiency on High-Resolution input data.