糖尿病性足潰瘍(DFU)の検出と認識のためのコンピューター手法と技術を含むかなりの量の研究がありますが、これに適用される最先端の深層学習オブジェクト検出フレームワークの体系的な比較が不足しています。問題。 DFUC2020は、トレーニング用の2,000枚の画像とテスト用の2,000枚の画像で構成される包括的なデータセットを参加者に提供しました。このホワイトペーパーでは、受賞チームによって提案された深層学習ベースのアルゴリズムを比較することにより、DFUC2020の結果を要約します。FasterR-CNN、Faster R-CNNの3つのバリアント、およびアンサンブル手法。 YOLOv3; YOLOv5; EfficientDet;そして新しいカスケードアテンションネットワーク。深層学習の方法ごとに、モデルアーキテクチャ、トレーニングのパラメーター設定、および前処理、データ拡張、後処理などの追加段階の詳細な説明を提供します。それぞれの方法について総合的な評価を行っています。すべての方法で、トレーニングに使用できる画像の数を増やすためのデータ拡張段階と、誤検知を取り除くための後処理段階が必要でした。最高のパフォーマンスは、FasterR-CNNのバリアントであるDeformableConvolutionから得られ、平均精度(mAP)は0.6940、F1-スコアは0.7434でした。最後に、さまざまな深層学習法に基づくアンサンブル法がF1-Scoreを強化できるが、mAPは強化できないことを示します。
There has been a substantial amount of research involving computer methods and technology for the detection and recognition of diabetic foot ulcers (DFUs), but there is a lack of systematic comparisons of state-of-the-art deep learning object detection frameworks applied to this problem. DFUC2020 provided participants with a comprehensive dataset consisting of 2,000 images for training and 2,000 images for testing. This paper summarises the results of DFUC2020 by comparing the deep learning-based algorithms proposed by the winning teams: Faster R-CNN, three variants of Faster R-CNN and an ensemble method; YOLOv3; YOLOv5; EfficientDet; and a new Cascade Attention Network. For each deep learning method, we provide a detailed description of model architecture, parameter settings for training and additional stages including pre-processing, data augmentation and post-processing. We provide a comprehensive evaluation for each method. All the methods required a data augmentation stage to increase the number of images available for training and a post-processing stage to remove false positives. The best performance was obtained from Deformable Convolution, a variant of Faster R-CNN, with a mean average precision (mAP) of 0.6940 and an F1-Score of 0.7434. Finally, we demonstrate that the ensemble method based on different deep learning methods can enhanced the F1-Score but not the mAP.