arXiv reaDer
内視鏡画像およびビデオのローカリゼーションのためのシャムネットワーク機能
Siamese Network Features for Endoscopy Image and Video Localization
従来の内視鏡検査(CE)およびワイヤレスカプセル内視鏡検査(WCE)は、胃腸(GI)管障害を診断するための既知のツールです。ローカライズフレームは、異常な場所に関する貴重な情報を提供し、臨床医がより適切な治療計画を決定するのにも役立ちます。異常を検出するための多くの自動化されたアルゴリズムがあります。ただし、ローカリゼーションの問題に対処している既存の作品はほとんどありません。この研究では、内視鏡画像とビデオの両方をローカライズするためのメタ学習とディープラーニングの組み合わせを紹介します。データセットは、人間の消化管の10の異なる解剖学的位置から収集されます。メタ学習セクションでは、システムは、単一の画像/フレームの位置を予測するために、修正されたシャムニューラルネットワーク(SNN)で78CEおよび27WCE注釈付きフレームを使用してトレーニングされました。次に、フレームのシーケンスをローカライズするために、双方向の長短期記憶を使用する後処理セクションが提案されます。ここでは、訓練されたSNNから得られた特徴ベクトル、距離、予測位置を採用しました。後処理セクションは、ホールドアウト検証(50%)を使用して1,028秒と365秒のCEおよびWCEビデオでトレーニングおよびテストされ、それぞれ86.3%および83.0%のF1スコアを達成しました。さらに、9人の消化器専門医を使用して主観的評価を行いました。結果は、コンピューター支援法が胃腸科医による局在化の評価よりも優れている可能性があることを示しています。提案手法は、手作りの特徴を備えたサポートベクターマシン、畳み込みニューラルネットワーク、転移学習ベースの手法など、さまざまなアプローチと比較され、より良い結果を示しました。したがって、フレームのローカリゼーションで使用でき、ビデオの要約と異常検出に役立ちます。
Conventional Endoscopy (CE) and Wireless Capsule Endoscopy (WCE) are known tools for diagnosing gastrointestinal (GI) tract disorders. Localizing frames provide valuable information about the anomaly location and also can help clinicians determine a more appropriate treatment plan. There are many automated algorithms to detect the anomaly. However, very few of the existing works address the issue of localization. In this study, we present a combination of meta-learning and deep learning for localizing both endoscopy images and video. A dataset is collected from 10 different anatomical positions of human GI tract. In the meta-learning section, the system was trained using 78 CE and 27 WCE annotated frames with a modified Siamese Neural Network (SNN) to predict the location of one single image/frame. Then, a postprocessing section using bidirectional long short-term memory is proposed for localizing a sequence of frames. Here, we have employed feature vector, distance and predicted location obtained from a trained SNN. The postprocessing section is trained and tested on 1,028 and 365 seconds of CE and WCE videos using hold-out validation (50%), and achieved F1-score of 86.3% and 83.0%, respectively. In addition, we performed subjective evaluation using nine gastroenterologists. The results show that the computer-aided methods can outperform gastroenterologists assessment of localization. The proposed method is compared with various approaches, such as support vector machine with hand-crafted features, convolutional neural network and the transfer learning-based methods, and showed better results. Therefore, it can be used in frame localization, which can help in video summarization and anomaly detection.
updated: Mon Mar 15 2021 16:24:30 GMT+0000 (UTC)
published: Mon Mar 15 2021 16:24:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト