arXiv reaDer
水中画像強調のためのセマンティック認識テクスチャ構造機能コラボレーション
Semantic-aware Texture-Structure Feature Collaboration for Underwater Image Enhancement
水中画像処理は、海洋工学および水中ロボット工学における重要な技術として魅力的なトピックになっています。ただし、限られた数のデータセットと不完全な手作りのグラウンド トゥルースにより、目に見えないシナリオに対する堅牢性が弱まり、高レベルのビジョン タスクへの適用が妨げられます。上記の制限に対処するために、低レベルの水中画像強調の補助としてその階層的特徴表現を活用することを目的として、高レベルのセマンティック認識事前トレーニングモデルと協力して効率的でコンパクトな強調ネットワークを開発します。具体的には、浅いレイヤーの特徴をテクスチャとして特徴付け、深いレイヤーの特徴をセマンティック認識モデルの構造として特徴付け、複数のスケールで特徴を洗練し、さまざまな機能。さらに、拡張ネットワークのさまざまな機能パターンへの適応のために、集約されたテクスチャおよび構造機能に対してチャネルごとの変調を実行する機能支配ネットワークが考案されています。ベンチマークに関する広範な実験は、提案されたアルゴリズムがより魅力的な結果を達成し、最先端の方法よりも大幅に優れていることを示しています。また、提案されたアルゴリズムを水中の顕著な物体検出タスクに適用して、高レベルの視覚タスクに適した意味認識能力を明らかにします。コードは STSC で入手できます。
Underwater image enhancement has become an attractive topic as a significant technology in marine engineering and aquatic robotics. However, the limited number of datasets and imperfect hand-crafted ground truth weaken its robustness to unseen scenarios, and hamper the application to high-level vision tasks. To address the above limitations, we develop an efficient and compact enhancement network in collaboration with a high-level semantic-aware pretrained model, aiming to exploit its hierarchical feature representation as an auxiliary for the low-level underwater image enhancement. Specifically, we tend to characterize the shallow layer features as textures while the deep layer features as structures in the semantic-aware model, and propose a multi-path Contextual Feature Refinement Module (CFRM) to refine features in multiple scales and model the correlation between different features. In addition, a feature dominative network is devised to perform channel-wise modulation on the aggregated texture and structure features for the adaptation to different feature patterns of the enhancement network. Extensive experiments on benchmarks demonstrate that the proposed algorithm achieves more appealing results and outperforms state-of-the-art methods by large margins. We also apply the proposed algorithm to the underwater salient object detection task to reveal the favorable semantic-aware ability for high-level vision tasks. The code is available at STSC.
updated: Sat Nov 19 2022 07:50:34 GMT+0000 (UTC)
published: Sat Nov 19 2022 07:50:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト