Video-based fully automatic assessment of open surgery suturing skills
この研究の目的は、リソースが限られている状況や国内の設定で医学生を訓練するための新しい信頼性の高い開腹手術縫合シミュレーションシステムを開発することでした。つまり、ツールと手の位置を特定するためのアルゴリズムを開発し、単純なWebカメラのビデオデータに基づいてツールと手の相互作用を識別し、手術スキルを評価するためのモーションメトリックを計算しました。 25人の参加者が私たちのシミュレーターを使用して複数の縫合タスクを実行しました。 YOLOネットワークは、ツールのローカリゼーションとツールと手の相互作用の検出を目的として、マルチタスクネットワークに変更されました。これは、YOLO検出ヘッドを分割して、コンピューターのランタイムへの追加を最小限に抑えながら両方のタスクをサポートすることで実現されました。さらに、システムの結果に基づいて、モーションメトリックが計算されました。これらのメトリックには、時間やパスの長さなどの従来のメトリックと、参加者がツールを保持するために使用する手法を評価する新しいメトリックが含まれていました。デュアルタスクネットワークのパフォーマンスは2つのネットワークのパフォーマンスと同様でしたが、計算負荷は1つのネットワークよりわずかに大きかっただけです。さらに、モーションメトリックは、専門家と初心者の間で有意差を示しました。ビデオキャプチャは低侵襲手術の重要な部分ですが、開腹手術の不可欠な要素ではありません。したがって、開腹手術のビデオが存在する固有の課題に焦点を当てた新しいアルゴリズムが必要です。この研究では、ローカリゼーションタスクとハンドツールインタラクションタスクの両方を解決するために、デュアルタスクネットワークが開発されました。デュアルネットワークは、マルチタスクネットワークに簡単に拡張できます。これは、複数のレイヤーを持つ画像や、これらの異なるレイヤー間の相互作用を評価するのに役立ちます。
The goal of this study was to develop new reliable open surgery suturing simulation system for training medical students in situation where resources are limited or in the domestic setup. Namely, we developed an algorithm for tools and hands localization as well as identifying the interactions between them based on simple webcam video data, calculating motion metrics for assessment of surgical skill. Twenty-five participants performed multiple suturing tasks using our simulator. The YOLO network has been modified to a multi-task network, for the purpose of tool localization and tool-hand interaction detection. This was accomplished by splitting the YOLO detection heads so that they supported both tasks with minimal addition to computer run-time. Furthermore, based on the outcome of the system, motion metrics were calculated. These metrics included traditional metrics such as time and path length as well as new metrics assessing the technique participants use for holding the tools. The dual-task network performance was similar to that of two networks, while computational load was only slightly bigger than one network. In addition, the motion metrics showed significant differences between experts and novices. While video capture is an essential part of minimally invasive surgery, it is not an integral component of open surgery. Thus, new algorithms, focusing on the unique challenges open surgery videos present, are required. In this study, a dual-task network was developed to solve both a localization task and a hand-tool interaction task. The dual network may be easily expanded to a multi-task network, which may be useful for images with multiple layers and for evaluating the interaction between these different layers.
updated: Tue Oct 26 2021 19:21:40 GMT+0000 (UTC)
published: Tue Oct 26 2021 19:21:40 GMT+0000 (UTC)
