arXiv reaDer
CholecTriplet2021:外科的アクショントリプレット認識のベンチマークチャレンジ
CholecTriplet2021: A benchmark challenge for surgical action triplet recognition
手術室での状況に応じた意思決定支援は、手術ワークフロー分析からのリアルタイムのフィードバックを活用することにより、手術の安全性と効率を高めることができます。ほとんどの既存の作品は、フェーズ、ステップ、イベントなどの大まかなレベルで外科的活動を認識し、外科的活動に関する詳細な相互作用の詳細を省略しています。それでも、これらは手術室でより役立つAI支援のために必要です。のトリプレットとしての外科的処置の認識組み合わせは、手術ビデオで行われている活動に関する包括的な詳細を提供します。この論文では、CholecTriplet2021を紹介します。腹腔鏡ビデオでの外科的処置のトリプレットの認識のためにMICCAI2021で組織された内視鏡ビジョンチャレンジです。このチャレンジにより、アクショントリプレット情報で注釈が付けられた大規模なCholecT50データセットへのプライベートアクセスが許可されました。この論文では、チャレンジのセットアップと、チャレンジ中に参加者によって提案された最先端の深層学習方法の評価を紹介します。チャレンジオーガナイザーによる合計4つのベースラインメソッドと、競合するチームによる19の新しいディープラーニングアルゴリズムが提示され、手術ビデオから直接手術アクショントリプレットを認識し、4.2%から38.1%の範囲の平均平均精度(mAP)を達成します。この研究はまた、提示されたアプローチによって得られた結果の重要性を分析し、それらの間の徹底的な方法論的比較、詳細な結果分析を実行し、認識を強化するための新しいアンサンブル手法を提案します。私たちの分析は、手術ワークフロー分析がまだ解決されていないことを示しており、手術におけるAIの開発にとって最も重要なきめ細かい手術活動認識に関する将来の研究の興味深い方向性も強調しています。
Context-aware decision support in the operating room can foster surgical safety and efficiency by leveraging real-time feedback from surgical workflow analysis. Most existing works recognize surgical activities at a coarse-grained level, such as phases, steps or events, leaving out fine-grained interaction details about the surgical activity; yet those are needed for more helpful AI assistance in the operating room. Recognizing surgical actions as triplets of combination delivers comprehensive details about the activities taking place in surgical videos. This paper presents CholecTriplet2021: an endoscopic vision challenge organized at MICCAI 2021 for the recognition of surgical action triplets in laparoscopic videos. The challenge granted private access to the large-scale CholecT50 dataset, which is annotated with action triplet information. In this paper, we present the challenge setup and assessment of the state-of-the-art deep learning methods proposed by the participants during the challenge. A total of 4 baseline methods from the challenge organizers and 19 new deep learning algorithms by competing teams are presented to recognize surgical action triplets directly from surgical videos, achieving mean average precision (mAP) ranging from 4.2% to 38.1%. This study also analyzes the significance of the results obtained by the presented approaches, performs a thorough methodological comparison between them, in-depth result analysis, and proposes a novel ensemble method for enhanced recognition. Our analysis shows that surgical workflow analysis is not yet solved, and also highlights interesting directions for future research on fine-grained surgical activity recognition which is of utmost importance for the development of AI in surgery.
updated: Sun Apr 10 2022 18:51:55 GMT+0000 (UTC)
published: Sun Apr 10 2022 18:51:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト