目的:外科的活動の認識は、コンピューター支援介入の基本的なステップです。この論文では、最近のデータ駆動型アプローチに焦点を当て、ロボット手術におけるきめ細かいジェスチャーを自動認識するための最先端の方法をレビューし、未解決の質問と将来の研究の方向性について概説します。方法:記事検索は、ロボット、ロボット支援、JIGSAWS、手術、外科、ジェスチャー、きめ細かい、外科手術、行動、軌道、セグメンテーション、認識、解析という検索用語を使用して、5つの書誌データベースで実行されました。選択された記事は、トレーニングに必要な監督のレベルに基づいて分類され、時系列分析とデータモデリングの主要なフレームワークを表すさまざまなグループに分けられました。結果:合計52件の記事がレビューされました。研究分野は急速に拡大しており、記事の大部分は過去4年間に公開されています。識別的特徴抽出とマルチモーダルデータ統合を備えた深層学習ベースの時間モデルは、小さな手術データセットで有望な結果を示しています。現在、教師なしの方法は、教師ありのアプローチよりもパフォーマンスが大幅に低下しています。結論:注釈付きデモンストレーションの大規模で多様なオープンソースデータセットの開発は、外科的ジェスチャ認識のための堅牢なソリューションの開発と検証に不可欠です。識別的特徴抽出と知識伝達、または教師なしおよび半教師ありアプローチの新しい戦略は、データとラベルの必要性を軽減できますが、同等のパフォーマンスを達成することはまだ実証されていません。重要な将来の研究の方向性には、ジェスチャー固有のエラーと異常の検出と予測が含まれます。重要性:このペーパーは、この急速に進化する分野の状況を要約することを目的とした、外科的ジェスチャー認識方法の包括的で構造化された分析です。
Objective: Surgical activity recognition is a fundamental step in computer-assisted interventions. This paper reviews the state-of-the-art in methods for automatic recognition of fine-grained gestures in robotic surgery focusing on recent data-driven approaches and outlines the open questions and future research directions. Methods: An article search was performed on 5 bibliographic databases with the following search terms: robotic, robot-assisted, JIGSAWS, surgery, surgical, gesture, fine-grained, surgeme, action, trajectory, segmentation, recognition, parsing. Selected articles were classified based on the level of supervision required for training and divided into different groups representing major frameworks for time series analysis and data modelling. Results: A total of 52 articles were reviewed. The research field is showing rapid expansion, with the majority of articles published in the last 4 years. Deep-learning-based temporal models with discriminative feature extraction and multi-modal data integration have demonstrated promising results on small surgical datasets. Currently, unsupervised methods perform significantly less well than the supervised approaches. Conclusion: The development of large and diverse open-source datasets of annotated demonstrations is essential for development and validation of robust solutions for surgical gesture recognition. While new strategies for discriminative feature extraction and knowledge transfer, or unsupervised and semi-supervised approaches, can mitigate the need for data and labels, they have not yet been demonstrated to achieve comparable performance. Important future research directions include detection and forecast of gesture-specific errors and anomalies. Significance: This paper is a comprehensive and structured analysis of surgical gesture recognition methods aiming to summarize the status of this rapidly evolving field.