arXiv reaDer
KiU-Net: Overcomplete Convolutional Architectures for Biomedical Image and Volumetric Segmentation
医療画像セグメンテーションのほとんどの方法は、ほとんどのアプリケーションで成功しているため、U-Netまたはそのバリアントを使用します。これらの「従来の」エンコーダ-デコーダベースのアプローチを詳細に分析した後、より小さな構造の検出ではパフォーマンスが低く、境界領域を正確にセグメント化できないことがわかりました。この問題は、エンコーダーを深く掘り下げるにつれて受容野のサイズが大きくなることに起因する可能性があります。高レベルの機能の学習に特に重点を置くと、U-Netベースのアプローチでは、小さな構造を検出するために重要な低レベルの機能に関する情報が少なくなります。この問題を克服するために、入力画像をより高い次元に投影して、受容野がネットワークの深層で増加するのを制限する、過度に完全な畳み込みアーキテクチャを使用することを提案します。画像セグメンテーションの新しいアーキテクチャを設計します-KiU-Netには2つのブランチがあります:(1)入力の細部と正確なエッジをキャプチャすることを学習する過剰な畳み込みネットワークKite-Net、および(2)高さを学習するU-Netレベルの機能。さらに、ボリュームセグメンテーションのための3D畳み込みアーキテクチャであるKiU-Net3Dも提案します。超音波(US)、磁気共鳴画像(MRI)、コンピューター断層撮影(CT)、顕微鏡画像、眼底画像などのさまざまな画像モダリティをカバーする5つの異なるデータセットで実験を行うことにより、KiU-Netの詳細な調査を行います。提案された方法は、より少ないパラメータとより速い収束という追加の利点とともに、最近のすべての方法と比較してより良いパフォーマンスを達成します。さらに、残りのブロックと密なブロックに基づくKiU-Netの拡張により、パフォーマンスがさらに向上することも示しています。 KiU-Netの実装はここで見つけることができます:
Most methods for medical image segmentation use U-Net or its variants as they have been successful in most of the applications. After a detailed analysis of these "traditional" encoder-decoder based approaches, we observed that they perform poorly in detecting smaller structures and are unable to segment boundary regions precisely. This issue can be attributed to the increase in receptive field size as we go deeper into the encoder. The extra focus on learning high level features causes the U-Net based approaches to learn less information about low-level features which are crucial for detecting small structures. To overcome this issue, we propose using an overcomplete convolutional architecture where we project our input image into a higher dimension such that we constrain the receptive field from increasing in the deep layers of the network. We design a new architecture for image segmentation- KiU-Net which has two branches: (1) an overcomplete convolutional network Kite-Net which learns to capture fine details and accurate edges of the input, and (2) U-Net which learns high level features. Furthermore, we also propose KiU-Net 3D which is a 3D convolutional architecture for volumetric segmentation. We perform a detailed study of KiU-Net by performing experiments on five different datasets covering various image modalities like ultrasound (US), magnetic resonance imaging (MRI), computed tomography (CT), microscopic and fundus images. The proposed method achieves a better performance as compared to all the recent methods with an additional benefit of fewer parameters and faster convergence. Additionally, we also demonstrate that the extensions of KiU-Net based on residual blocks and dense blocks result in further performance improvements. The implementation of KiU-Net can be found here:
updated: Thu Oct 14 2021 20:27:36 GMT+0000 (UTC)
published: Sun Oct 04 2020 19:23:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト