arXiv reaDer
サイコロの損失勾配とそれを模倣する方法について
On the dice loss gradient and the ways to mimic it
ここ数年、完全に教師ありのセマンティック セグメンテーションのコンテキストで、クロス エントロピーやダイスなどのいくつかの損失が、ニューラル ネットワークを監視するための事実上の標準として浮上しています。ダイスの損失は、人気のあるダイス係数の緩和に起因するため、興味深いケースです。医用画像アプリケーションにおける主要な評価指標の 1 つです。この論文では、最初にサイコロ損失の勾配を理論的に研究し、具体的にはそれがグラウンド トゥルースの重み付き負であり、ダイナミック レンジが非常に小さいことを示します。これにより、このホワイト ペーパーの第 2 部では、ネットワーク出力とグラウンド トゥルースの負値を単純な要素ごとに乗算することで、ダイス損失の監視を模倣することができます。このかなり驚くべき結果は、勾配降下中のサイコロの損失によって実行される実際の監視に光を当てます。これは、新しい損失を設計する際に研究者を導きながら、開業医が結果を理解し解釈するのに役立ちます。
In the past few years, in the context of fully-supervised semantic segmentation, several losses -- such as cross-entropy and dice -- have emerged as de facto standards to supervise neural networks. The Dice loss is an interesting case, as it comes from the relaxation of the popular Dice coefficient; one of the main evaluation metric in medical imaging applications. In this paper, we first study theoretically the gradient of the dice loss, showing that concretely it is a weighted negative of the ground truth, with a very small dynamic range. This enables us, in the second part of this paper, to mimic the supervision of the dice loss, through a simple element-wise multiplication of the network output with a negative of the ground truth. This rather surprising result sheds light on the practical supervision performed by the dice loss during gradient descent. This can help the practitioner to understand and interpret results while guiding researchers when designing new losses.
updated: Sun Apr 09 2023 21:25:07 GMT+0000 (UTC)
published: Sun Apr 09 2023 21:25:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト