arXiv reaDer
最小-最大類似性:手術器具セグメンテーションのための対照的な半教師あり深層学習ネットワーク
Min-Max Similarity: A Contrastive Semi-Supervised Deep Learning Network for Surgical Tools Segmentation
画像のセグメンテーションは、医療AIで人気のあるトピックです。これは主に、ニューラルネットワークをトレーニングするためにかなりの数のピクセルレベルの注釈付きデータを取得することが難しいためです。この問題に対処するために、対照学習に基づく半教師ありセグメンテーションネットワークを提案しました。以前の最先端技術とは対照的に、最小-最大類似性(MMS)を導入します。これは、分類器とプロジェクターを使用して、それぞれすべての負の機能と正の機能のペア、および負の機能のペアを構築することによる、デュアルビュートレーニングの対照的な学習形式です。最小-最大類似性問題を解くものとして学習問題を定式化する。すべて負のペアは、さまざまなビューから学習するネットワークを監視し、一般的な特徴を確実にキャプチャするために使用されます。ラベルなしの予測の一貫性は、正と負のペア間のピクセル単位のコントラスト損失によって測定されます。提案された方法を定量的および定性的に評価するために、2つの公開内視鏡手術ツールセグメンテーションデータセットと1つの人工内耳手術データセットでテストします。これらのデータセットは、手術ビデオで人工内耳に手動で注釈を付けます。セグメンテーションのパフォーマンス(ダイス係数)は、提案された方法が、最先端の半教師ありおよび完全に監視されたセグメンテーションアルゴリズムよりも一貫して優れていることを示しています。また、半教師ありセグメンテーションアルゴリズムは、未知の手術器具を正常に認識し、適切な予測を提供できます。また、MMSは約40フレーム/秒(fps)を達成でき、リアルタイムのビデオセグメンテーションを処理するのに適しています。
Segmentation of images is a popular topic in medical AI. This is mainly due to the difficulty to obtain a significant number of pixel-level annotated data to train a neural network. To address this issue, we proposed a semi-supervised segmentation network based on contrastive learning. In contrast to the previous state-of-the-art, we introduce Min-Max Similarity (MMS), a contrastive learning form of dual-view training by employing classifiers and projectors to build all-negative, and positive and negative feature pairs respectively to formulate the learning problem as solving min-max similarity problem. The all-negative pairs are used to supervise the networks learning from different views and make sure to capture general features, and the consistency of unlabeled predictions is measured by pixel-wise contrastive loss between positive and negative pairs. To quantitative and qualitative evaluate our proposed method, we test it on two public endoscopy surgical tool segmentation datasets and one cochlear implant surgery dataset which we manually annotate the cochlear implant in surgical videos. The segmentation performance (dice coefficients) indicates that our proposed method outperforms state-of-the-art semi-supervised and fully supervised segmentation algorithms consistently. And our semi-supervised segmentation algorithm can successfully recognize unknown surgical tools and provide good predictions. Also, our MMS could achieve about 40 frames per second (fps) and suitable to deal with the real-time video segmentation.
updated: Wed Jun 01 2022 00:07:05 GMT+0000 (UTC)
published: Tue Mar 29 2022 01:40:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト