arXiv reaDer
ウォーム スタートを活用して胸部 X 線レポートの生成を改善
Improving Chest X-Ray Report Generation by Leveraging Warm Starting
患者の胸部 X 線 (CXR) からレポートを自動的に生成することは、臨床作業負荷を軽減し、患者ケアを向上させるための有望なソリューションです。しかし、現在の CXR レポート ジェネレーター (主にエンコーダーからデコーダーへのモデル) は、臨床現場で導入できる診断精度に欠けています。 CXR レポート生成を改善するために、Vision Transformer (ViT) や PubMedBERT などの最近のオープンソース コンピューター ビジョンおよび自然言語処理チェックポイントを使用したエンコーダーとデコーダーのウォーム スタートを調査します。この目的を達成するために、各チェックポイントは MIMIC-CXR および IU X 線データセットで評価されます。私たちの実験的調査により、畳み込みビジョン Transformer (CvT) ImageNet-21K と Distilled Generative Pretrained Transformer 2 (DistilGPT2) チェックポイントが、それぞれエンコーダーとデコーダーのウォーム スタートに最適であることが実証されました。最先端技術 (M^2 Transformer Progressive) と比較して、CvT2DistilGPT2 は CE F-1 で 8.3%、BLEU-4 で 1.8%、ROUGE-L で 1.6%、METEOR で 1.0% の改善を達成しました。 。 CvT2DistilGPT2 によって生成されたレポートは、以前のアプローチよりも放射線科医のレポートとの類似性が高くなります。これは、ウォーム スタートを利用すると CXR レポートの生成が向上することを示しています。 CvT2DistilGPT2 のコードとチェックポイントは、https://github.com/aehrc/cvt2distilgpt2 で入手できます。
Automatically generating a report from a patient's Chest X-Rays (CXRs) is a promising solution to reducing clinical workload and improving patient care. However, current CXR report generators -- which are predominantly encoder-to-decoder models -- lack the diagnostic accuracy to be deployed in a clinical setting. To improve CXR report generation, we investigate warm starting the encoder and decoder with recent open-source computer vision and natural language processing checkpoints, such as the Vision Transformer (ViT) and PubMedBERT. To this end, each checkpoint is evaluated on the MIMIC-CXR and IU X-Ray datasets. Our experimental investigation demonstrates that the Convolutional vision Transformer (CvT) ImageNet-21K and the Distilled Generative Pre-trained Transformer 2 (DistilGPT2) checkpoints are best for warm starting the encoder and decoder, respectively. Compared to the state-of-the-art (M^2 Transformer Progressive), CvT2DistilGPT2 attained an improvement of 8.3% for CE F-1, 1.8% for BLEU-4, 1.6% for ROUGE-L, and 1.0% for METEOR. The reports generated by CvT2DistilGPT2 have a higher similarity to radiologist reports than previous approaches. This indicates that leveraging warm starting improves CXR report generation. Code and checkpoints for CvT2DistilGPT2 are available at https://github.com/aehrc/cvt2distilgpt2.
updated: Wed Jul 12 2023 23:14:28 GMT+0000 (UTC)
published: Mon Jan 24 2022 00:46:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト