手術器具を追跡するためのセグメンテーションは、ロボット支援手術で重要な役割を果たします。手術器具のセグメンテーションは、追跡のための正確な空間情報のキャプチャに貢献します。この論文では、新しいネットワークである洗練されたアテンションセグメンテーションネットワークが、手術器具を同時にセグメント化し、そのカテゴリを識別するために提案されています。セグメンテーションで一般的なU字型ネットワークが使用されます。以前の作業とは異なり、アテンションモジュールが採用されており、ネットワークが主要な領域に集中できるようになっています。これにより、セグメンテーションの精度が向上します。クラスの不均衡問題を解決するために、クロスエントロピー損失とJaccardインデックスの対数の加重和が損失関数として使用されます。さらに、私たちのネットワークでは転移学習が採用されています。エンコーダーはImageNetで事前トレーニングされています。 MICCAI EndoVis Challenge 2017のデータセットは、ネットワークの評価に使用されます。このデータセットに基づいて、私たちのネットワークは、94.65%がDiceを、90.33%がIOUを意味する最先端のパフォーマンスを達成しています。
Segmentation for tracking surgical instruments plays an important role in robot-assisted surgery. Segmentation of surgical instruments contributes to capturing accurate spatial information for tracking. In this paper, a novel network, Refined Attention Segmentation Network, is proposed to simultaneously segment surgical instruments and identify their categories. The U-shape network which is popular in segmentation is used. Different from previous work, an attention module is adopted to help the network focus on key regions, which can improve the segmentation accuracy. To solve the class imbalance problem, the weighted sum of the cross entropy loss and the logarithm of the Jaccard index is used as loss function. Furthermore, transfer learning is adopted in our network. The encoder is pre-trained on ImageNet. The dataset from the MICCAI EndoVis Challenge 2017 is used to evaluate our network. Based on this dataset, our network achieves state-of-the-art performance 94.65% mean Dice and 90.33% mean IOU.