arXiv reaDer
内視鏡画像におけるマルチクラス異常検出のための識別可能なオートエンコーダのスタック
Stack of discriminative autoencoders for multiclass anomaly detection in endoscopy images
ワイヤレスカプセル内視鏡検査(WCE)は、医師が非侵襲的に胃腸(GI)管を検査するのに役立ちます。マルチクラス分類における内視鏡画像の病理学的評価に取り組む研究はほとんどなく、それらのほとんどは、バイナリ異常検出に基づいているか、特定のタイプの異常を検出することを目的としています。マルチクラスの異常検出は、特にデータセットのサンプリングが不十分であるか、不均衡である場合に困難です。 KID2など、内視鏡検査の分野で利用可能なデータセットの多くは、不均衡の問題に悩まされており、高性能モデルのトレーニングが困難になっています。さらに、クラスの数を増やすと、分類がより困難になります。任意の数のクラスに拡張可能で、不均衡の問題を処理できるマルチクラス分類アルゴリズムを提案しました。提案された方法は、複数のオートエンコーダーを使用し、各オートエンコーダーを1つのクラスでトレーニングして、他のクラスから最も区別された特徴を抽出します。オートエンコーダの損失関数は、再構成、コンパクトさ、他のクラスからの距離、およびカルバックライブラー(KL)の発散に基づいて設定されます。抽出された特徴はクラスター化され、サポートベクターデータ記述子のアンサンブルを使用して分類されます。 KID2データセットからの合計1,778の正常、227の炎症、303の血管、および44のポリープ画像が評価に使用されます。アルゴリズム全体が5回実行され、バイナリおよびマルチクラスの異常検出のテストセットでそれぞれ96.3±0.2%および85.0±0.4%のF1スコアを達成しました。アルゴリズムの各ステップの影響は、さまざまなアブレーション研究によって調査され、結果は公開された作品と比較されました。提案されたアプローチは、GI分野のマルチクラス異常を検出するための競争力のあるオプションです。
Wireless Capsule Endoscopy (WCE) helps physicians examine the gastrointestinal (GI) tract noninvasively. There are few studies that address pathological assessment of endoscopy images in multiclass classification and most of them are based on binary anomaly detection or aim to detect a specific type of anomaly. Multiclass anomaly detection is challenging, especially when the dataset is poorly sampled or imbalanced. Many available datasets in endoscopy field, such as KID2, suffer from an imbalance issue, which makes it difficult to train a high-performance model. Additionally, increasing the number of classes makes classification more difficult. We proposed a multiclass classification algorithm that is extensible to any number of classes and can handle an imbalance issue. The proposed method uses multiple autoencoders where each one is trained on one class to extract features with the most discrimination from other classes. The loss function of autoencoders is set based on reconstruction, compactness, distance from other classes, and Kullback-Leibler (KL) divergence. The extracted features are clustered and then classified using an ensemble of support vector data descriptors. A total of 1,778 normal, 227 inflammation, 303 vascular, and 44 polyp images from the KID2 dataset are used for evaluation. The entire algorithm ran 5 times and achieved F1-score of 96.3 +- 0.2% and 85.0 +- 0.4% on the test set for binary and multiclass anomaly detection, respectively. The impact of each step of the algorithm was investigated by various ablation studies and the results were compared with published works. The suggested approach is a competitive option for detecting multiclass anomalies in the GI field.
updated: Thu Aug 19 2021 19:06:06 GMT+0000 (UTC)
published: Mon Mar 15 2021 16:28:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト