arXiv reaDer
内視鏡検査のためのバイモーダルカメラポーズ予測
Bimodal Camera Pose Prediction for Endoscopy
画像から内視鏡シーンの3D構造を推測することは、依然として非常に困難です。変形と視界に依存する照明に加えて、結腸のような管状構造は、自己閉塞性の反復的な解剖学的構造に起因する問題を提示します。本論文では、大腸内視鏡検査におけるカメラ姿勢推定のための合成データセットであるSimColと、内視鏡姿勢を予測するためにバイモーダル分布を明示的に学習する新しい方法を提案します。私たちのデータセットは、実際の結腸内視鏡の動きを複製し、既存の方法の欠点を浮き彫りにします。対応する深度とカメラポーズを使用して、シミュレートされた結腸内視鏡検査から18k RGB画像を公開し、Unityのデータ生成環境を公開します。さまざまなカメラポーズ予測方法を評価し、データでトレーニングすると、実際の結腸内視鏡検査シーケンスに一般化され、バイモーダルアプローチが以前のユニモーダル作業よりも優れていることを示します。
Deducing the 3D structure of endoscopic scenes from images remains extremely challenging. In addition to deformation and view-dependent lighting, tubular structures like the colon present problems stemming from the self-occluding, repetitive anatomical structures. In this paper, we propose SimCol, a synthetic dataset for camera pose estimation in colonoscopy and a novel method that explicitly learns a bimodal distribution to predict the endoscope pose. Our dataset replicates real colonoscope motion and highlights drawbacks of existing methods. We publish 18k RGB images from simulated colonoscopy with corresponding depth and camera poses and make our data generation environment in Unity publicly available. We evaluate different camera pose prediction methods and demonstrate that, when trained on our data, they generalize to real colonoscopy sequences and our bimodal approach outperforms prior unimodal work.
updated: Mon Apr 11 2022 09:34:34 GMT+0000 (UTC)
published: Mon Apr 11 2022 09:34:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト