arXiv reaDer
トランスフォーマーを使用した胸部X線写真におけるマルチモーダル疾患分類の事前知識としての適応
Indication as Prior Knowledge for Multimodal Disease Classification in Chest Radiographs with Transformers
臨床医が画像検査のために患者を紹介するとき、スキャン要求に理由(例えば、関連する患者の病歴、疑わしい病気)を含めます。これは、放射線レポートの表示フィールドとして表示されます。画像の解釈と報告は、この要求テキストの影響を大きく受け、放射線科医が画像の特定の側面に焦点を合わせるようになります。表示フィールドを使用して、テキストでユニモーダルに事前トレーニングされたトランスネットワーク(BERT)を取得し、デュアルイメージテキスト入力のマルチモーダル分類用に微調整することで、より良い画像分類を推進します。 MIMIC-CXRデータセットでメソッドを評価し、分類パフォーマンスに対する表示フィールドの影響を調査するためのアブレーション研究を提示します。実験結果は、私たちのアプローチが87.8の平均マイクロAUROCを達成し、ユニモーダル(84.4)およびマルチモーダル(86.0)分類の最先端の方法を上回っていることを示しています。私たちのコードはhttps://github.com/jacenkow/mmbtで入手できます。
When a clinician refers a patient for an imaging exam, they include the reason (e.g. relevant patient history, suspected disease) in the scan request; this appears as the indication field in the radiology report. The interpretation and reporting of the image are substantially influenced by this request text, steering the radiologist to focus on particular aspects of the image. We use the indication field to drive better image classification, by taking a transformer network which is unimodally pre-trained on text (BERT) and fine-tuning it for multimodal classification of a dual image-text input. We evaluate the method on the MIMIC-CXR dataset, and present ablation studies to investigate the effect of the indication field on the classification performance. The experimental results show our approach achieves 87.8 average micro AUROC, outperforming the state-of-the-art methods for unimodal (84.4) and multimodal (86.0) classification. Our code is available at https://github.com/jacenkow/mmbt.
updated: Sat Feb 12 2022 14:23:30 GMT+0000 (UTC)
published: Sat Feb 12 2022 14:23:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト