arXiv reaDer
自動デコードされたディープ潜在埋め込みを使用した主観的評価からの学習
Learning from Subjective Ratings Using Auto-Decoded Deep Latent Embeddings
アプリケーションによっては、放射線診断は評価者間および評価者内の高い変動性と関連している可能性があります。ほとんどのコンピューター支援診断(CAD)ソリューションは、このようなデータを議論の余地のないものとして扱い、学習アルゴリズムをかなりの、場合によっては矛盾するラベルノイズやバイアスにさらします。したがって、ラベルの主観性を管理することは、医用画像分析における基本的な問題です。この課題に対処するために、自動デコードされたディープ潜在埋め込み(ADDLE)を導入します。これは、自動デコーダーフレームワークを使用して各評価者の傾向を明示的にモデル化します。単純な線形変換の後、潜在変数を任意の複数のポイントで任意のバックボーンに注入できるため、モデルは診断に対する評価者固有の影響を考慮することができます。重要なことに、ADDLEはトレーニングで画像ごとに複数の評価者を期待していません。つまり、病院のアーカイブからマイニングされたデータから簡単に学習できます。さらに、評価者が追加されても、ADDLEのトレーニングの複雑さは増しません。推論中に、各評価者をシミュレートし、「平均」または「貪欲」な仮想評価を生成できます。 2D超音波(US)からの脂肪肝診断の問題についてADDLEをテストするために、65人の異なる評価者からの米国の臨床診断とともに46084件の研究を収集します。ゴールドスタンダードの生検診断を備えた別のデータセットを使用して、診断パフォーマンスを評価しました。 ADDLEは、重度の脂肪症を診断するための曲線下部分面積(AUC)を、標準の分類器より10.5%向上させると同時に、パラメーターの65倍を必要とするアプローチを含む他のアノテーターノイズアプローチを上回ります。
Depending on the application, radiological diagnoses can be associated with high inter- and intra-rater variabilities. Most computer-aided diagnosis (CAD) solutions treat such data as incontrovertible, exposing learning algorithms to considerable and possibly contradictory label noise and biases. Thus, managing subjectivity in labels is a fundamental problem in medical imaging analysis. To address this challenge, we introduce auto-decoded deep latent embeddings (ADDLE), which explicitly models the tendencies of each rater using an auto-decoder framework. After a simple linear transformation, the latent variables can be injected into any backbone at any and multiple points, allowing the model to account for rater-specific effects on the diagnosis. Importantly, ADDLE does not expect multiple raters per image in training, meaning it can readily learn from data mined from hospital archives. Moreover, the complexity of training ADDLE does not increase as more raters are added. During inference each rater can be simulated and a 'mean' or 'greedy' virtual rating can be produced. We test ADDLE on the problem of liver steatosis diagnosis from 2D ultrasound (US) by collecting 46 084 studies along with clinical US diagnoses originating from 65 different raters. We evaluated diagnostic performance using a separate dataset with gold-standard biopsy diagnoses. ADDLE can improve the partial areas under the curve (AUCs) for diagnosing severe steatosis by 10.5% over standard classifiers while outperforming other annotator-noise approaches, including those requiring 65 times the parameters.
updated: Fri Apr 16 2021 17:53:38 GMT+0000 (UTC)
published: Mon Apr 12 2021 15:40:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト