arXiv reaDer
術中の外科的スキルのビデオベースの評価
Video-based assessment of intraoperative surgical skill
目的:この調査の目的は、手術室での外科技能のビデオベースの評価のための最先端の方法の包括的な分析を提供することです。方法:白内障手術の重要なステップである嚢切開の99本のビデオのデータセットを使用して、主にベンチトップ設定での外科的スキル評価のために以前に開発された機能ベースの方法を評価します。さらに、RGBビデオを使用してスキルを直接評価する2つの深層学習方法を提示して検証します。最初の方法では、機器の先端をキーポイントとして予測し、時間畳み込みニューラルネットワークを使用して外科的スキルを学習します。 2番目の方法では、フレームワイズエンコーダー(2D畳み込みニューラルネットワーク)とそれに続く時間モデル(リカレントニューラルネットワーク)を含む、外科的スキル評価のための新しいアーキテクチャを提案します。どちらも視覚的注意メカニズムによって強化されます。受信者動作特性曲線の下の領域、感度、特異度、および予測値を、5分割交差検定を通じて各メソッドで報告します。結果:バイナリスキル分類(エキスパートと初心者)のタスクの場合、ディープニューラルネットワークベースの方法は、従来の時空間インタレストポイントベースの方法よりも高いAUCを示します。注意メカニズムを使用したニューラルネットワークアプローチも、高い感度と特異性を示しました。結論:手術室での手術スキルのビデオベースの評価には、ディープラーニング手法が必要です。 RGBビデオを直接使用してスキルを直接評価するための注意メカニズムを使用したネットワークの内部妥当性に関する私たちの調査結果は、他のデータセットの外部妥当性について評価する必要があります。
Purpose: The objective of this investigation is to provide a comprehensive analysis of state-of-the-art methods for video-based assessment of surgical skill in the operating room. Methods: Using a data set of 99 videos of capsulorhexis, a critical step in cataract surgery, we evaluate feature based methods previously developed for surgical skill assessment mostly under benchtop settings. In addition, we present and validate two deep learning methods that directly assess skill using RGB videos. In the first method, we predict instrument tips as keypoints, and learn surgical skill using temporal convolutional neural networks. In the second method, we propose a novel architecture for surgical skill assessment that includes a frame-wise encoder (2D convolutional neural network) followed by a temporal model (recurrent neural network), both of which are augmented by visual attention mechanisms. We report the area under the receiver operating characteristic curve, sensitivity, specificity, and predictive values with each method through 5-fold cross-validation. Results: For the task of binary skill classification (expert vs. novice), deep neural network based methods exhibit higher AUC than the classical spatiotemporal interest point based methods. The neural network approach using attention mechanisms also showed high sensitivity and specificity. Conclusion: Deep learning methods are necessary for video-based assessment of surgical skill in the operating room. Our findings of internal validity of a network using attention mechanisms to assess skill directly using RGB videos should be evaluated for external validity in other data sets.
updated: Fri May 13 2022 01:45:22 GMT+0000 (UTC)
published: Fri May 13 2022 01:45:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト