arXiv reaDer
胸部X線レポート生成のための変分トピック推論
Variational Topic Inference for Chest X-Ray Report Generation
医用画像のレポート生成を自動化することで、作業負荷を軽減し、臨床診療における診断を支援することができます。最近の研究では、深層学習モデルが自然画像のキャプションに成功できることが示されています。ただし、医療データからの学習は、専門知識と経験が異なるさまざまな放射線科医によって作成されたレポートに固有の多様性と不確実性のために困難です。これらの課題に取り組むために、自動レポート生成のための変分トピック推論を提案します。具体的には、潜在変数として一連のトピックを紹介し、潜在空間で画像と言語のモダリティを調整することによって文の生成をガイドします。トピックは条件付き変分推論フレームワークで推論され、各トピックがレポート内の文の生成を管理します。さらに、モデルが画像内のさまざまな場所に注意を向け、より有益な説明を生成できるようにする視覚的注意モジュールを採用しています。インディアナ大学の胸部X線とMIMIC-CXRの2つのベンチマークで広範な実験を行っています。結果は、提案された変分トピック推論方法が、トレーニングで使用されるレポートの単なるコピーではなく、新しいレポートを生成できる一方で、標準言語生成基準に関して最先端の方法と同等のパフォーマンスを達成できることを示しています。
Automating report generation for medical imaging promises to reduce workload and assist diagnosis in clinical practice. Recent work has shown that deep learning models can successfully caption natural images. However, learning from medical data is challenging due to the diversity and uncertainty inherent in the reports written by different radiologists with discrepant expertise and experience. To tackle these challenges, we propose variational topic inference for automatic report generation. Specifically, we introduce a set of topics as latent variables to guide sentence generation by aligning image and language modalities in a latent space. The topics are inferred in a conditional variational inference framework, with each topic governing the generation of a sentence in the report. Further, we adopt a visual attention module that enables the model to attend to different locations in the image and generate more informative descriptions. We conduct extensive experiments on two benchmarks, namely Indiana U. Chest X-rays and MIMIC-CXR. The results demonstrate that our proposed variational topic inference method can generate novel reports rather than mere copies of reports used in training, while still achieving comparable performance to state-of-the-art methods in terms of standard language generation criteria.
updated: Thu Jul 15 2021 13:34:38 GMT+0000 (UTC)
published: Thu Jul 15 2021 13:34:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト