arXiv reaDer
私は見た、考えた、結論した: ボトルネックとしての進歩的な概念
I saw, I conceived, I concluded: Progressive Concepts as Bottlenecks
概念ボトルネック モデル (CBM) には、人間が解釈できる概念のボトルネックが含まれており、予測された中間概念を修正することで、推論中に説明可能性と介入を提供します。これにより、CBM はハイステークスの意思決定にとって魅力的になります。このホワイト ペーパーでは、胎児の超音波スキャンの品質評価を、ヘルスケアにおける CBM 意思決定支援の実際のユース ケースとして取り上げます。この場合、単純なバイナリ コンセプトは十分に信頼性が高くありません。それらは、変数モデル キャリブレーションが不安定な 2 値化されたコンセプトにつながる可能性がある、変動性の高い品質の画像から直接マッピングされるためです。さらに、スカラーの概念は、ユーザーが要求する直感的な空間フィードバックを提供しません。これに対処するために、「見る」、「考える」、「結論する」という一連の専門家の意思決定プロセスを模倣する階層的CBMを設計します。私たちのモデルは、最初に視覚的なセグメンテーションに基づく概念のレイヤーを通過し、次に意思決定タスクに直接関連するプロパティの概念の 2 番目のレイヤーを通過します。専門家は、推論中にビジュアルとプロパティの両方の概念に介入できることに注意してください。さらに、タスクに関連する概念の相互作用を考慮することで、ボトルネックの容量を増やします。超音波スキャン品質評価の適用は、標準化された画像コンテンツの可視性と幾何学的特性の評価に対して (しばしば悪い) 画像品質のバランスを取ることに依存しているため、困難です。私たちの検証では、以前の CBM モデルとは対照的に、予測性能に関して、私たちの CBM モデルは同等の概念のないモデルよりも実際に優れていることが示されています。さらに、介入が最先端技術よりもパフォーマンスをさらに向上させる方法を示します。
Concept bottleneck models (CBMs) include a bottleneck of human-interpretable concepts providing explainability and intervention during inference by correcting the predicted, intermediate concepts. This makes CBMs attractive for high-stakes decision-making. In this paper, we take the quality assessment of fetal ultrasound scans as a real-life use case for CBM decision support in healthcare. For this case, simple binary concepts are not sufficiently reliable, as they are mapped directly from images of highly variable quality, for which variable model calibration might lead to unstable binarized concepts. Moreover, scalar concepts do not provide the intuitive spatial feedback requested by users. To address this, we design a hierarchical CBM imitating the sequential expert decision-making process of "seeing", "conceiving" and "concluding". Our model first passes through a layer of visual, segmentation-based concepts, and next a second layer of property concepts directly associated with the decision-making task. We note that experts can intervene on both the visual and property concepts during inference. Additionally, we increase the bottleneck capacity by considering task-relevant concept interaction. Our application of ultrasound scan quality assessment is challenging, as it relies on balancing the (often poor) image quality against an assessment of the visibility and geometric properties of standardized image content. Our validation shows that -- in contrast with previous CBM models -- our CBM models actually outperform equivalent concept-free models in terms of predictive performance. Moreover, we illustrate how interventions can further improve our performance over the state-of-the-art.
updated: Sat Nov 19 2022 09:31:19 GMT+0000 (UTC)
published: Sat Nov 19 2022 09:31:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト