arXiv reaDer
対照的なクロスモーダル事前トレーニング:少量サンプル医用画像の一般的な戦略
Contrastive Cross-Modal Pre-Training: A General Strategy for Small Sample Medical Imaging
特定の医用画像タスクのためにニューラルネットワークをトレーニングする際の重要な課題は、多くの場合、手動でラベル付けされた十分な数の例を取得することの難しさです。対照的に、医療記録ですぐに利用できることが多いテキスト画像レポートには、標準的な臨床診療の一部として専門家によって書かれた豊富で構造化されていない解釈が含まれています。これらのテキストレポートを弱い監視の形式として使用して、手動でラベル付けされた追加の例を必要とせずにニューラルネットワークの画像解釈パフォーマンスを向上させることを提案します。画像とテキストのマッチングタスクを使用して特徴抽出器をトレーニングし、小さなラベル付きデータセットを使用して、監視対象タスクの転送学習設定で微調整します。最終結果は、推論中にテキストレポートを必要とせずに画像を自動的に解釈するニューラルネットワークです。このアプローチは、テキストと画像のペアがすぐに利用できるすべてのタスクに適用できます。 3つの分類タスクでメソッドを評価し、一貫したパフォーマンスの向上を確認し、ラベル付きデータの必要性を67%〜98%削減します。
A key challenge in training neural networks for a given medical imaging task is often the difficulty of obtaining a sufficient number of manually labeled examples. In contrast, textual imaging reports, which are often readily available in medical records, contain rich but unstructured interpretations written by experts as part of standard clinical practice. We propose using these textual reports as a form of weak supervision to improve the image interpretation performance of a neural network without requiring additional manually labeled examples. We use an image-text matching task to train a feature extractor and then fine-tune it in a transfer learning setting for a supervised task using a small labeled dataset. The end result is a neural network that automatically interprets imagery without requiring textual reports during inference. This approach can be applied to any task for which text-image pairs are readily available. We evaluate our method on three classification tasks and find consistent performance improvements, reducing the need for labeled data by 67%-98%.
updated: Wed Aug 25 2021 03:06:10 GMT+0000 (UTC)
published: Tue Oct 06 2020 22:20:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト