GREN: X 線画像における弱教師付き疾患位置特定のためのグラフ正則化埋め込みネットワーク
GREN: Graph-Regularized Embedding Network for Weakly-Supervised Disease Localization in X-ray Images
注意深い注釈をほとんど使用せずに胸部 X 線画像で疾患を特定することで、人的労力を大幅に節約できます。最近の研究では、マルチインスタンス学習 (MIL) やクラス活性化マップ (CAM) などの革新的な弱教師付きアルゴリズムを使用してこのタスクに取り組みましたが、これらの方法では不正確または不完全な領域が生じることがよくあります。その理由の 1 つは、各画像内の解剖学的領域間の関係と画像間の関係に隠された病理学的意味を無視していることです。このホワイトペーパーでは、より一貫性のある統合された領域を取得するために、コンテキストおよび補償情報としてのクロス領域およびクロスイメージの関係が不可欠であると主張します。この関係をモデル化するために、画像内および画像間情報を活用して胸部 X 線画像上の疾患を特定する Graph Regularized Embedding Network (GREN) を提案します。 GREN は、トレーニング済みの U-Net を使用して肺葉をセグメント化し、画像内グラフを使用して肺葉間の画像内関係をモデル化し、異なる領域を比較します。一方、バッチ内の画像間の関係は、画像間グラフによってモデル化され、複数の画像を比較します。このプロセスは、放射線科医のトレーニングと意思決定プロセスを模倣しており、複数の領域と画像を比較して診断します。ニューラル ネットワークの深い埋め込みレイヤーが構造情報 (ローカリゼーション タスクで重要) を保持するために、ハッシュ コーディングとハミング距離を使用してグラフを計算します。これらは、トレーニングを容易にする正則化として使用されます。これにより、私たちのアプローチは、NIH 胸部 X 線データセットで最先端の結果を達成し、教師が不十分な疾患の局在化を実現します。私たちのコードはオンラインでアクセスできます (。
Locating diseases in chest X-ray images with few careful annotations saves large human effort. Recent works approached this task with innovative weakly-supervised algorithms such as multi-instance learning (MIL) and class activation maps (CAM), however, these methods often yield inaccurate or incomplete regions. One of the reasons is the neglection of the pathological implications hidden in the relationship across anatomical regions within each image and the relationship across images. In this paper, we argue that the cross-region and cross-image relationship, as contextual and compensating information, is vital to obtain more consistent and integral regions. To model the relationship, we propose the Graph Regularized Embedding Network (GREN), which leverages the intra-image and inter-image information to locate diseases on chest X-ray images. GREN uses a pre-trained U-Net to segment the lung lobes, and then models the intra-image relationship between the lung lobes using an intra-image graph to compare different regions. Meanwhile, the relationship between in-batch images is modeled by an inter-image graph to compare multiple images. This process mimics the training and decision-making process of a radiologist: comparing multiple regions and images for diagnosis. In order for the deep embedding layers of the neural network to retain structural information (important in the localization task), we use the Hash coding and Hamming distance to compute the graphs, which are used as regularizers to facilitate training. By means of this, our approach achieves the state-of-the-art result on NIH chest X-ray dataset for weakly-supervised disease localization. Our codes are accessible online (
updated: Fri Aug 05 2022 02:53:23 GMT+0000 (UTC)
published: Wed Jul 14 2021 01:27:07 GMT+0000 (UTC)
