arXiv reaDer
Encoding Visual Attributes in Capsules for Explainable Medical Diagnoses
畳み込みニューラルネットワークベースのシステムは、解釈が非常に困難な「ブラックボックス」の性質により、ヘルスケア、軍事、セキュリティ、輸送、金融、法律などの多くのリスクの高いアプリケーション領域での採用にほとんど失敗しています。この欠陥を解決するために、私たちは人間の専門家が使用するのと同じ高水準言語を具体化することによって予測の説明可能性を改善するための新しいマルチタスクカプセルネットワークを教えます。説明可能なカプセルネットワークであるX-Capsは、カプセルのベクトル内の高レベルのビジュアルオブジェクト属性をエンコードし、これらの人間が解釈可能な機能のみに基づいて予測を形成します。属性をエンコードするために、X-Capsは新しいルーティングシグモイド関数を利用して、子カプセルから親に情報を個別にルーティングします。さらに、放射線科医にモデルの信頼性の推定値を提供するために、専門家のラベルの分布についてネットワークをトレーニングし、観察者間の合意をモデル化し、トレーニング中に信頼性の過不足を罰し、専門家の同意によって監視します。 X-Capsは、肺がんスクリーニング患者の1000以上のCTスキャンの多施設データセットから属性と悪性度のスコアを同時に学習します。説明のつかない3D CNNに近い悪性予測スコアを提供しながら、シンプルな2Dカプセルネットワークが、視覚的に解釈可能な高レベルの属性と悪性予測をキャプチャする際に、最先端の深密デュアルパス3D CNNよりも優れていることを示します。 。私たちの知る限りでは、これは放射線科医レベルの解釈可能な属性に基づいて予測を行うためのカプセルネットワークと医療画像診断へのその応用を調査する最初の研究です。コードはで公開されています。
Convolutional neural network based systems have largely failed to be adopted in many high-risk application areas, including healthcare, military, security, transportation, finance, and legal, due to their highly uninterpretable "black-box" nature. Towards solving this deficiency, we teach a novel multi-task capsule network to improve the explainability of predictions by embodying the same high-level language used by human-experts. Our explainable capsule network, X-Caps, encodes high-level visual object attributes within the vectors of its capsules, then forms predictions based solely on these human-interpretable features. To encode attributes, X-Caps utilizes a new routing sigmoid function to independently route information from child capsules to parents. Further, to provide radiologists with an estimate of model confidence, we train our network on a distribution of expert labels, modeling inter-observer agreement and punishing over/under confidence during training, supervised by human-experts' agreement. X-Caps simultaneously learns attribute and malignancy scores from a multi-center dataset of over 1000 CT scans of lung cancer screening patients. We demonstrate a simple 2D capsule network can outperform a state-of-the-art deep dense dual-path 3D CNN at capturing visually-interpretable high-level attributes and malignancy prediction, while providing malignancy prediction scores approaching that of non-explainable 3D CNNs. To the best of our knowledge, this is the first study to investigate capsule networks for making predictions based on radiologist-level interpretable attributes and its applications to medical image diagnosis. Code is publicly available at .
updated: Sat Jun 20 2020 23:52:39 GMT+0000 (UTC)
published: Thu Sep 12 2019 20:04:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト