例えば、以下のような計算を要求する方法を使用して処理できる画像のサイズには制限があります。畳み込みニューラルネットワーク(CNN)。一部のイメージングモダリティ(特に生物学的および医療的)では、最大数ギガピクセルのサイズの画像が生成される可能性があります。つまり、処理のために小さな部分またはパッチに分割する必要があります。ただし、画像のセグメンテーションを実行すると、最終的な再結合画像のエッジ効果など、望ましくないアーティファクトが発生する可能性があります。このようなエッジ効果を効果的に低減するために、信号処理からウィンドウ法を導入します。イメージパッチの中央部分は、その辺や角よりも豊富なコンテキスト情報を保持することが多いという前提で、2次元ウィンドウに応じて重み付けされたパッチを重ねることで予測を再構築します。 4つの異なるウィンドウの結果を比較します:Hann、Bartlett-Hann、Triangular、およびCui et al。によって最近提案されたウィンドウ、およびコサインベースのHannウィンドウが構造類似性インデックス(SSIM)によって測定される最高の改善を達成することを示します。提案されたウィンドウ方式は、セグメンテーションのためにCNNモデルと一緒に変更なしで使用でき、ネットワーク予測を大幅に改善します。
There is a limitation in the size of an image that can be processed using computationally demanding methods such as e.g. Convolutional Neural Networks (CNNs). Some imaging modalities - notably biological and medical - can result in images up to a few gigapixels in size, meaning that they have to be divided into smaller parts, or patches, for processing. However, when performing image segmentation, this may lead to undesirable artefacts, such as edge effects in the final re-combined image. We introduce windowing methods from signal processing to effectively reduce such edge effects. With the assumption that the central part of an image patch often holds richer contextual information than its sides and corners, we reconstruct the prediction by overlapping patches that are being weighted depending on 2-dimensional windows. We compare the results of four different windows: Hann, Bartlett-Hann, Triangular and a recently proposed window by Cui et al., and show that the cosine-based Hann window achieves the best improvement as measured by the Structural Similarity Index (SSIM). The proposed windowing method can be used together with any CNN model for segmentation without any modification and significantly improves network predictions.