arXiv reaDer
ハイパースペクトル画像におけるロバストな深層学習ベースの意味器官セグメンテーション
Robust deep learning-based semantic organ segmentation in hyperspectral images
セマンティック画像のセグメンテーションは、手術におけるコンテキストアウェアネスと自律型ロボットの重要な前提条件です。最先端技術は、低侵襲手術中に取得された従来のRGBビデオデータに焦点を合わせてきましたが、スペクトルイメージングデータに基づいて開腹手術中に取得されたフルシーンセマンティックセグメンテーションは、これまでほとんど注目されていません。文献のこのギャップに対処するために、オープン手術環境で取得されたブタのハイパースペクトルイメージング(HSI)データに基づいて、次の研究課題を調査しています。(1)ニューラルネットワークベースの完全自動化されたHSIデータの適切な表現は何ですか。臓器のセグメンテーション、特にデータの空間的粒度(ピクセル対スーパーピクセル対パッチ対完全画像)に関して? (2)セマンティック臓器セグメンテーションを実行するときに、他のモダリティ、つまりRGBデータおよび処理されたHSIデータ(酸素化などの組織パラメーターなど)と比較してHSIデータを使用する利点はありますか?合計19のクラスで注釈が付けられた、20頭の豚からの506のHSI画像に基づく包括的な検証研究によると、深層学習ベースのセグメンテーションパフォーマンスは、入力データの空間コンテキストによって、モダリティ全体で一貫して向上します。未処理のHSIデータは、RGBデータやカメラプロバイダーからの処理済みデータよりも優れており、ニューラルネットワークへの入力のサイズが小さくなると利点が大きくなります。最大パフォーマンス(画像全体に適用されたHSI)は、0.89の平均ダイス類似度係数(DSC)(標準偏差(SD)0.04)をもたらしました。これは、評価者間変動(DSC 0.89(SD 0.07))の範囲内です。 HSIは、追加の機能的組織情報を回復する機能など、従来のイメージングに比べて多くの利点を備えた、完全自動の手術シーン理解のための強力な画像モダリティになる可能性があると結論付けています。
Semantic image segmentation is an important prerequisite for context-awareness and autonomous robotics in surgery. The state of the art has focused on conventional RGB video data acquired during minimally invasive surgery, but full-scene semantic segmentation based on spectral imaging data and obtained during open surgery has received almost no attention to date. To address this gap in the literature, we are investigating the following research questions based on hyperspectral imaging (HSI) data of pigs acquired in an open surgery setting: (1) What is an adequate representation of HSI data for neural network-based fully automated organ segmentation, especially with respect to the spatial granularity of the data (pixels vs. superpixels vs. patches vs. full images)? (2) Is there a benefit of using HSI data compared to other modalities, namely RGB data and processed HSI data (e.g. tissue parameters like oxygenation), when performing semantic organ segmentation? According to a comprehensive validation study based on 506 HSI images from 20 pigs, annotated with a total of 19 classes, deep learning-based segmentation performance increases - consistently across modalities - with the spatial context of the input data. Unprocessed HSI data offers an advantage over RGB data or processed data from the camera provider, with the advantage increasing with decreasing size of the input to the neural network. Maximum performance (HSI applied to whole images) yielded a mean dice similarity coefficient (DSC) of 0.89 (standard deviation (SD) 0.04), which is in the range of the inter-rater variability (DSC of 0.89 (SD 0.07)). We conclude that HSI could become a powerful image modality for fully-automatic surgical scene understanding with many advantages over traditional imaging, including the ability to recover additional functional tissue information.
updated: Tue Nov 09 2021 20:37:38 GMT+0000 (UTC)
published: Tue Nov 09 2021 20:37:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト