COTR: Convolution in Transformer Network for End to End Polyp Detection
目的:結腸直腸癌(CRC)は、世界で2番目に多い癌による死亡原因です。結腸内視鏡検査は、結腸のスクリーニングとポリープ病変の診断に広く使用されている手法です。それにもかかわらず、結腸内視鏡検査を使用した手動スクリーニングは、ポリープのかなりのミス率に悩まされており、内視鏡医にとって圧倒的な負担である。ポリープ検出のためのコンピューター支援診断(CAD)は、人的エラーと人的負担を軽減する可能性があります。ただし、オブジェクト検出フレームワークに基づく現在のポリープ検出方法には、ドメイン固有の知識を必要とする多くの手作りの前処理および後処理操作またはユーザーガイダンスが必要です。方法:この論文では、エンドツーエンドのポリープ検出のためのトランスフォーマー(COTR)ネットワークの畳み込みを提案します。 COTRは、検出トランスフォーマー(DETR)によって動機付けられ、特徴抽出用のCNN、特徴エンコードと再キャリブレーション用の畳み込みレイヤーでインターリーブされたトランスフォーマーエンコーダーレイヤー、オブジェクトクエリ用のトランスフォーマーデコーダーレイヤー、および検出予測用のフィードフォワードネットワークで構成されます。 DETRの収束が遅いことを考慮して、COTRは、特徴の再構築と収束の加速のために、畳み込みレイヤーをトランスフォーマーエンコーダーに埋め込みます。結果:2つの公開ポリープデータセットの実験結果は、COTRがETIS-LARIBで91.49%の精度、82.69%の感度、86.87%のF1スコアを達成し、91.67%の精度、93.54%の感度、92.60%のF1スコアを達成したことを示しています。 CVC-ColonDB。結論:この研究は、結腸直腸ポリープ検出のための検出トランスに基づくエンドツーエンドの検出方法を提案した。 ETIS-LARIBおよびCVC-ColonDBデータセットの実験結果は、提案されたモデルが最先端の方法と同等のパフォーマンスを達成したことを示しました。
Purpose: Colorectal cancer (CRC) is the second most common cause of cancer mortality worldwide. Colonoscopy is a widely used technique for colon screening and polyp lesions diagnosis. Nevertheless, manual screening using colonoscopy suffers from a substantial miss rate of polyps and is an overwhelming burden for endoscopists. Computer-aided diagnosis (CAD) for polyp detection has the potential to reduce human error and human burden. However, current polyp detection methods based on object detection framework need many handcrafted pre-processing and post-processing operations or user guidance that require domain-specific knowledge. Methods: In this paper, we propose a convolution in transformer (COTR) network for end-to-end polyp detection. Motivated by the detection transformer (DETR), COTR is constituted by a CNN for feature extraction, transformer encoder layers interleaved with convolutional layers for feature encoding and recalibration, transformer decoder layers for object querying, and a feed-forward network for detection prediction. Considering the slow convergence of DETR, COTR embeds convolution layers into transformer encoder for feature reconstruction and convergence acceleration. Results: Experimental results on two public polyp datasets show that COTR achieved 91.49% precision, 82.69% sensitivity, and 86.87% F1-score on the ETIS-LARIB, and 91.67% precision, 93.54% sensitivity, and 92.60% F1-score on the CVC-ColonDB. Conclusion: This study proposed an end to end detection method based on detection transformer for colorectal polyp detection. Experimental results on ETIS-LARIB and CVC-ColonDB dataset demonstrated that the proposed model achieved comparable performance against state-of-the-art methods.
updated: Sun May 23 2021 12:36:48 GMT+0000 (UTC)
published: Sun May 23 2021 12:36:48 GMT+0000 (UTC)
