最近では、畳み込みニューラルネットワークはセマンティックセグメンテーションで広く使用されています。ただし、CNNベースのセグメンテーションネットワークは、豊富なセマンティック情報を含む低解像度の出力を生成するため、セグメンテーション結果の空間的詳細(たとえば、小さな物体や細かい境界情報)が失われることは避けられません。画像のセグメンテーションへの変分アプローチ(つまり、レベルセット理論)に動機付けられたこの問題に対処するために、セグメンテーション結果の空間的詳細を洗練するように設計されたレベルセットロスと呼ばれる新しい損失関数を提案します。画像内の複数のクラスを扱うために、最初にグラウンドトゥルースをバイナリ画像に分解します。各バイナリ画像は、背景とクラスに属する領域で構成されていることに注意してください。次に、レベルセット関数をクラス確率マップに変換し、各クラスのエネルギーを計算します。ネットワークは、レベルセット損失とクロスエントロピー損失の加重合計を最小化するようにトレーニングされます。提案されたレベルセット損失は、時間とメモリの効率的な方法でセグメンテーション結果の空間的詳細を改善します。さらに、実験結果は、提案された損失関数が以前のアプローチよりも優れたパフォーマンスを達成することを示しています。
Thesedays, Convolutional Neural Networks are widely used in semantic segmentation. However, since CNN-based segmentation networks produce low-resolution outputs with rich semantic information, it is inevitable that spatial details (e.g., small bjects and fine boundary information) of segmentation results will be lost. To address this problem, motivated by a variational approach to image segmentation (i.e., level set theory), we propose a novel loss function called the level set loss which is designed to refine spatial details of segmentation results. To deal with multiple classes in an image, we first decompose the ground truth into binary images. Note that each binary image consists of background and regions belonging to a class. Then we convert level set functions into class probability maps and calculate the energy for each class. The network is trained to minimize the weighted sum of the level set loss and the cross-entropy loss. The proposed level set loss improves the spatial details of segmentation results in a time and memory efficient way. Furthermore, our experimental results show that the proposed loss function achieves better performance than previous approaches.