arXiv reaDer
MRを標的とした前立腺生検のための戦略的テンプレートガイド下針配置
Strategising template-guided needle placement for MR-targeted prostate biopsy
術前の磁気共鳴(MR)画像で見つかった疑わしい病変がターゲットとして使用される場合、臨床的に重要な前立腺癌は、超音波ガイド下生検手順中にサンプリングされる可能性が高くなります。ただし、生検手順の診断精度は、ターゲットのサンプリングにおけるオペレーター依存のスキルと経験、超音波プローブのナビゲートと潜在的に複数のターゲットの一連のサンプリング針の配置を含む一連の意思決定プロセスによって制限されます。この作業は、MRターゲットを効率的かつ十分にサンプリングできるように、ガイドテンプレートに対して2D超音波ビューと生検針の連続位置決めのアクションを最適化する強化学習(RL)ポリシーを学習することを目的としています。まず、タスクをマルコフ決定過程(MDP)として定式化し、MR画像から得られた解剖学的構造と病変に基づいて、個々の患者に対して仮想的にターゲティングアクションを実行できる環境を構築します。したがって、MDP環境でのポジティブサンプリングに報いることにより、各生検手順の前に、患者固有のポリシーを最適化できます。 54人の前立腺癌患者からの実験結果は、提案されたRL学習ポリシーが93%の平均ヒット率と11mmの平均癌コア長を獲得したことを示しています。これらの臨床的に関連する指標を直接最大化する報酬。おそらくもっと興味深いことに、RLエージェントは病変のサイズに適応する戦略を学習し、針の広がりがより小さな病変に対して優先されたことがわかりました。このような戦略は、これまで報告されておらず、臨床現場でも一般的に採用されていませんが、直感的に設計された戦略と比較した場合、全体的に優れたターゲティングパフォーマンスをもたらしました。
Clinically significant prostate cancer has a better chance to be sampled during ultrasound-guided biopsy procedures, if suspected lesions found in pre-operative magnetic resonance (MR) images are used as targets. However, the diagnostic accuracy of the biopsy procedure is limited by the operator-dependent skills and experience in sampling the targets, a sequential decision making process that involves navigating an ultrasound probe and placing a series of sampling needles for potentially multiple targets. This work aims to learn a reinforcement learning (RL) policy that optimises the actions of continuous positioning of 2D ultrasound views and biopsy needles with respect to a guiding template, such that the MR targets can be sampled efficiently and sufficiently. We first formulate the task as a Markov decision process (MDP) and construct an environment that allows the targeting actions to be performed virtually for individual patients, based on their anatomy and lesions derived from MR images. A patient-specific policy can thus be optimised, before each biopsy procedure, by rewarding positive sampling in the MDP environment. Experiment results from fifty four prostate cancer patients show that the proposed RL-learned policies obtained a mean hit rate of 93% and an average cancer core length of 11 mm, which compared favourably to two alternative baseline strategies designed by humans, without hand-engineered rewards that directly maximise these clinically relevant metrics. Perhaps more interestingly, it is found that the RL agents learned strategies that were adaptive to the lesion size, where spread of the needles was prioritised for smaller lesions. Such a strategy has not been previously reported or commonly adopted in clinical practice, but led to an overall superior targeting performance when compared with intuitively designed strategies.
updated: Thu Jul 21 2022 23:27:07 GMT+0000 (UTC)
published: Thu Jul 21 2022 23:27:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト