メラノーマの早期発見は人間の目には困難ですが、死亡率を減らすための重要なステップです。これらの黒色腫およびその他の皮膚病変のコンピューターによる検出が必要です。この論文の中心的な研究課題は、「利用可能なデータが少ないニューラルネットワークを使用して皮膚病変画像をセグメント化する方法」です。この質問は、最高のパフォーマンスのネットワーク構造、トレーニングデータ、トレーニング方法に関する3つのサブ質問に分かれています。これらの質問に関連する最初の理論について説明します。文献では、U-net CNN構造はセグメンテーションタスクで優れたパフォーマンスを発揮し、トレーニングデータを増やすとネットワークのパフォーマンスが向上し、転送学習を利用することでネットワークを新しいデータに一般化できるようになると述べています。文献でこれらの発見を検証するために、2つの実験が行われます。最初の実験では、異なるサイズのデータセットでネットワークをトレーニングします。 2番目の実験では、12のネットワーク構造を提案し、それらを同じデータセットでトレーニングします。実験結果は、文献の発見を裏付けています。 FCN16およびFCN32ネットワークは、精度、ユニオンの交差、および平均BF1スコアメトリックで最高のパフォーマンスを発揮します。これらの結果から結論として、皮膚病変セグメンテーションネットワークは、スキップアーキテクチャと1または2のエンコーダ深度を持つ完全な畳み込み構造です。このネットワークの重みは、事前に訓練されたVGG16ネットワークからの転送学習を使用して初期化する必要があります。トレーニングデータは、複雑さを軽減するために切り取り、トレーニング中に増強して過剰適合の可能性を減らす必要があります。
Early detection of melanoma is difficult for the human eye but a crucial step towards reducing its death rate. Computerized detection of these melanoma and other skin lesions is necessary. The central research question in this paper is "How to segment skin lesion images using a neural network with low available data?". This question is divided into three sub questions regarding best performing network structure, training data and training method. First theory associated with these questions is discussed. Literature states that U-net CNN structures have excellent performances on the segmentation task, more training data increases network performance and utilizing transfer learning enables networks to generalize to new data better. To validate these findings in the literature two experiments are conducted. The first experiment trains a network on data sets of different size. The second experiment proposes twelve network structures and trains them on the same data set. The experimental results support the findings in the literature. The FCN16 and FCN32 networks perform best in the accuracy, intersection over union and mean BF1 Score metric. Concluding from these results the skin lesion segmentation network is a fully convolutional structure with a skip architecture and an encoder depth of either one or two. Weights of this network should be initialized using transfer learning from the pre trained VGG16 network. Training data should be cropped to reduce complexity and augmented during training to reduce the likelihood of overfitting.