水中不純物の光吸収と散乱は、水中イメージングの品質を低下させます。既存のデータ駆動型ベースの水中画像エンハンスメント(UIE)技術には、さまざまな水中シーンと忠実度の高い参照画像を含む大規模なデータセットがないという問題があります。その上、異なるカラーチャネルと空間領域での一貫性のない減衰は、ブーストされたエンハンスメントについて完全には考慮されていません。この作業では、5004の画像ペアを含む大規模な水中画像(LSUI)データセットを構築し、トランスモデルがUIEタスクに初めて導入されたU字型トランスフォーマーネットワークを報告しました。 U字型トランスフォーマーは、チャネルごとのマルチスケール機能融合トランスフォーマー(CMSFFT)モジュールおよび空間ごとのグローバル機能モデリングトランスフォーマー(SGFMT)モジュールと統合されており、カラーチャネルおよび空間領域へのネットワークの注意をさらに強化します。深刻な減衰。一方、コントラストと彩度をさらに向上させるために、RGB、LAB、LCH色空間を組み合わせた新しい損失関数が人間の視覚原理に従って設計されています。利用可能なデータセットに関する広範な実験により、報告された手法の最先端のパフォーマンスが2dBを超える優位性で検証されています。
The light absorption and scattering of underwater impurities lead to poor underwater imaging quality. The existing data-driven based underwater image enhancement (UIE) techniques suffer from the lack of a large-scale dataset containing various underwater scenes and high-fidelity reference images. Besides, the inconsistent attenuation in different color channels and space areas is not fully considered for boosted enhancement. In this work, we constructed a large-scale underwater image (LSUI) dataset including 5004 image pairs, and reported an U-shape Transformer network where the transformer model is for the first time introduced to the UIE task. The U-shape Transformer is integrated with a channel-wise multi-scale feature fusion transformer (CMSFFT) module and a spatial-wise global feature modeling transformer (SGFMT) module, which reinforce the network's attention to the color channels and space areas with more serious attenuation. Meanwhile, in order to further improve the contrast and saturation, a novel loss function combining RGB, LAB and LCH color spaces is designed following the human vision principle. The extensive experiments on available datasets validate the state-of-the-art performance of the reported technique with more than 2dB superiority.