CFPNet-M: A Light-Weight Encoder-Decoder Based Network for Multimodal Biomedical Image Real-Time Segmentation
現在、深層学習技術の開発により、医用画像のパターンを識別、分類、および定量化するための手段が提供されています。セグメンテーションは、医療画像分析における重要なアプリケーションの1つです。この点で、U-Netは医療画像セグメンテーションタスクへの主要なアプローチです。ただし、これらのU-Netベースのモデルには、いくつかの側面で制限があることがわかりました。たとえば、U-Netの数百万のパラメーターがかなりの計算リソースとメモリを消費し、グローバル情報が不足し、いくつかの難しいオブジェクトが欠落しています。したがって、U-Netモデルを改善するために2つの変更を適用しました。1)拡張されたチャネルワイズCNNモジュールを設計および追加し、2)U字型ネットワークを簡素化しました。これらの2つの変更に基づいて、新しい軽量アーキテクチャを提案しました。これは、医療用チャネルごとの特徴ピラミッドネットワーク(CFPNet-M)です。私たちの方法を評価するために、サーモグラフィー、電子顕微鏡、内視鏡検査、ダーモスコピー、およびデジタル網膜画像の異なるモダリティを持つ5つのデータセットを選択しました。そして、そのパフォーマンスを、パラメータースケールが異なるいくつかのモデルと比較しました。このホワイトペーパーには、DC-UNetおよび一般的に使用されている軽量ニューラルネットワークに関するこれまでの研究も含まれています。グレーレベル画像測定には、ジャッカード係数の代わりに谷本類似性を適用しました。比較すると、CFPNet-Mは、U-Netの約2%であるわずか65万のパラメーターと、8.8 MBのメモリを使用して、5つの医療データセットすべてで同等のセグメンテーション結果を達成します。一方、推論速度は、256 x192ピクセルの入力サイズの単一のRTX2070TiGPUで80FPSに達する可能性があります。
Currently, developments of deep learning techniques are providing instrumental to identify, classify, and quantify patterns in medical images. Segmentation is one of the important applications in medical image analysis. In this regard, U-Net is the predominant approach to medical image segmentation tasks. However, we found that those U-Net based models have limitations in several aspects, for example, millions of parameters in the U-Net consuming considerable computation resource and memory, lack of global information, and missing some tough objects. Therefore, we applied two modifications to improve the U-Net model: 1) designed and added the dilated channel-wise CNN module, 2) simplified the U shape network. Based on these two modifications, we proposed a novel light-weight architecture -- Channel-wise Feature Pyramid Network for Medicine (CFPNet-M). To evaluate our method, we selected five datasets with different modalities: thermography, electron microscopy, endoscopy, dermoscopy, and digital retinal images. And we compared its performance with several models having different parameter scales. This paper also involves our previous studies of DC-UNet and some commonly used light-weight neural networks. We applied the Tanimoto similarity instead of the Jaccard index for gray-level image measurements. By comparison, CFPNet-M achieves comparable segmentation results on all five medical datasets with only 0.65 million parameters, which is about 2% of U-Net, and 8.8 MB memory. Meanwhile, the inference speed can reach 80 FPS on a single RTX 2070Ti GPU with the 256 by 192 pixels input size.
updated: Mon May 10 2021 02:29:11 GMT+0000 (UTC)
published: Mon May 10 2021 02:29:11 GMT+0000 (UTC)
