arXiv reaDer
網膜OCT画像のマルチスケールスパース表現ベースのシャドウ修復
Multi-scale Sparse Representation-Based Shadow Inpainting for Retinal OCT Images
網膜光コヒーレンストモグラフィー(OCT)画像で表面血管によって投影された影付きの領域を修復することは、正確で堅牢な機械分析と臨床診断にとって重要です。欠落している領域を徐々に埋めるために隣接情報を伝播するなどの従来のシーケンスベースのアプローチは、費用効果が高いです。しかし、より大きな欠落領域やテクスチャが豊富な構造を処理する場合、満足のいく結果は得られません。エンコーダ-デコーダネットワークなどの新しい深層学習ベースの方法は、自然な画像修復タスクで有望な結果を示しています。ただし、通常、ネットワークトレーニングには長い計算時間が必要であり、データセットのサイズに対する需要が高いため、多くの場合小さな医療データセットに適用することは困難です。これらの課題に対処するために、スパース表現とディープラーニングを相乗的に適用することにより、OCT画像用の新しいマルチスケールシャドウ修復フレームワークを提案します。スパース表現は、少量のトレーニング画像から特徴を抽出してさらに修復し、その後の画像を正規化するために使用されます。マルチスケール画像融合、畳み込みニューラルネットワーク(CNN)を使用して画質を向上させます。画像の修復中に、前処理された入力画像をシャドウ幅に基づいてさまざまなブランチに分割し、さまざまなスケールから補足情報を収集します。最後に、スパース表現ベースの正則化モジュールは、マルチスケールの特徴集約後に生成されたコンテンツを改良するように設計されています。実験は、私たちの提案を、合成および実世界の影に関する従来の手法と深層学習に基づく手法の両方と比較するために実施されます。結果は、特に広い影が提示された場合に、提案された方法が視覚的品質と定量的メトリックの観点から好ましい画像修復を達成することを示しています。
Inpainting shadowed regions cast by superficial blood vessels in retinal optical coherence tomography (OCT) images is critical for accurate and robust machine analysis and clinical diagnosis. Traditional sequence-based approaches such as propagating neighboring information to gradually fill in the missing regions are cost-effective. But they generate less satisfactory outcomes when dealing with larger missing regions and texture-rich structures. Emerging deep learning-based methods such as encoder-decoder networks have shown promising results in natural image inpainting tasks. However, they typically need a long computational time for network training in addition to the high demand on the size of datasets, which makes it difficult to be applied on often small medical datasets. To address these challenges, we propose a novel multi-scale shadow inpainting framework for OCT images by synergically applying sparse representation and deep learning: sparse representation is used to extract features from a small amount of training images for further inpainting and to regularize the image after the multi-scale image fusion, while convolutional neural network (CNN) is employed to enhance the image quality. During the image inpainting, we divide preprocessed input images into different branches based on the shadow width to harvest complementary information from different scales. Finally, a sparse representation-based regularizing module is designed to refine the generated contents after multi-scale feature aggregation. Experiments are conducted to compare our proposal versus both traditional and deep learning-based techniques on synthetic and real-world shadows. Results demonstrate that our proposed method achieves favorable image inpainting in terms of visual quality and quantitative metrics, especially when wide shadows are presented.
updated: Wed Feb 23 2022 09:37:14 GMT+0000 (UTC)
published: Wed Feb 23 2022 09:37:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト