ニューラルネットワークをトレーニングして画像またはボリュームのセグメンテーションを実行する方法を紹介します。この方法では、セグメント化されたオブジェクトのトポロジに関する事前の知識を明示的に提供し、トレーニングプロセスに組み込むことができます。トポロジーデータ分析で使用される概念である永続的ホモロジーの微分可能なプロパティを使用することにより、セグメント化されたオブジェクトの望ましいトポロジーをベティ数で指定し、提案されたセグメンテーションを指定されたトポロジー機能を含むように駆動できます。重要なのは、このプロセスでは、セグメント化されている構造のトポロジーに関する事前の知識があるだけで、グラウンドトゥルースラベルは必要ありません。 3つの実験で私たちのアプローチを示します。最初に、手書きのMNISTディジットをノイズ除去する合成タスクを作成し、このようなトポロジー的な事前知識をネットワークのトレーニングで使用すると、ノイズ除去されたディジットの品質が大幅に向上することを示します。次に、タスクが左心室の心筋を心臓の磁気共鳴画像から分割する実験を行います。この解剖学のトポロジーの事前知識を組み込むことにより、トポロジーの精度とダイス係数の両方の観点から、結果のセグメンテーションが改善されることを示します。 3番目に、3Dボリュームにメソッドを拡張し、超音波データから胎盤をセグメント化するタスクでそのパフォーマンスを実証します。トポロジーの事前情報を組み込むと、この困難なタスクのパフォーマンスが向上することを示します。ニューラルネットワークのセグメンテーションタスクに明示的な事前知識を埋め込むことは、セグメンテーションタスクが特に困難である場合に最も有益であり、半教師ありまたは後処理のコンテキストで使用して、ピクセル単位のラベルのない画像から有用なトレーニング勾配を抽出できることがわかります。
We introduce a method for training neural networks to perform image or volume segmentation in which prior knowledge about the topology of the segmented object can be explicitly provided and then incorporated into the training process. By using the differentiable properties of persistent homology, a concept used in topological data analysis, we can specify the desired topology of segmented objects in terms of their Betti numbers and then drive the proposed segmentations to contain the specified topological features. Importantly this process does not require any ground-truth labels, just prior knowledge of the topology of the structure being segmented. We demonstrate our approach in three experiments. Firstly we create a synthetic task in which handwritten MNIST digits are de-noised, and show that using this kind of topological prior knowledge in the training of the network significantly improves the quality of the de-noised digits. Secondly we perform an experiment in which the task is segmenting the myocardium of the left ventricle from cardiac magnetic resonance images. We show that the incorporation of the prior knowledge of the topology of this anatomy improves the resulting segmentations in terms of both the topological accuracy and the Dice coefficient. Thirdly, we extend the method to 3D volumes and demonstrate its performance on the task of segmenting the placenta from ultrasound data, again showing that incorporating topological priors improves performance on this challenging task. We find that embedding explicit prior knowledge in neural network segmentation tasks is most beneficial when the segmentation task is especially challenging and that it can be used in either a semi-supervised or post-processing context to extract a useful training gradient from images without pixelwise labels.