arXiv reaDer
より高速なR-CNNによる胸のしこりの検出:ノイズの多い注釈からの学習の実現可能性について
Breast Mass Detection with Faster R-CNN: On the Feasibility of Learning from Noisy Annotations
この作業では、医療領域のオブジェクト検出ネットワークのトレーニングに対するノイズの影響と、トレーニング手順を改善することによってノイズを軽減する方法を研究します。データを大量に消費する深層学習モデルをトレーニングするために大規模な医療データセットに注釈を付けることは、費用と時間がかかります。テキストレポート、ブックマーク、または病変測定の形で、臨床診療ですでに収集されている情報を活用することで、このコストを大幅に削減できます。ただし、自動マイニング手順で正確な病変境界ボックスを取得することは困難です。ここでは、胸のしこり検出用のFasterR-CNNオブジェクト検出ネットワークのパフォーマンスに対するバウンディングボックス座標ノイズの影響の定量的評価を提供します。さまざまな程度のノイズは、バウンディングボックスをランダムに変更することによってシミュレートされます。私たちの実験では、バウンディングボックスは元のサイズの最大6倍に拡大できました。ノイズは、正確な病変位置が利用できる、十分にキュレーションされた公開マンモグラフィデータセットであるCBIS-DDSMコレクションに注入されます。グラウンドトゥルースとネットワークバウンディングボックスの提案のマッチングが不完全なため、トレーニング中にノイズが伝播し、バックグラウンドから病変を正しく分類するネットワークの能力が低下する方法を示します。標準の交差点オーバーユニオン基準を使用すると、FROC曲線の下の面積が最大9%減少します。ノイズに対する耐性を改善するために、新しいマッチング基準が提案されています。
In this work we study the impact of noise on the training of object detection networks for the medical domain, and how it can be mitigated by improving the training procedure. Annotating large medical datasets for training data-hungry deep learning models is expensive and time consuming. Leveraging information that is already collected in clinical practice, in the form of text reports, bookmarks or lesion measurements would substantially reduce this cost. Obtaining precise lesion bounding boxes through automatic mining procedures, however, is difficult. We provide here a quantitative evaluation of the effect of bounding box coordinate noise on the performance of Faster R-CNN object detection networks for breast mass detection. Varying degrees of noise are simulated by randomly modifying the bounding boxes: in our experiments, bounding boxes could be enlarged up to six times the original size. The noise is injected in the CBIS-DDSM collection, a well curated public mammography dataset for which accurate lesion location is available. We show how, due to an imperfect matching between the ground truth and the network bounding box proposals, the noise is propagated during training and reduces the ability of the network to correctly classify lesions from background. When using the standard Intersection over Union criterion, the area under the FROC curve decreases by up to 9%. A novel matching criterion is proposed to improve tolerance to noise.
updated: Sun Apr 25 2021 17:43:58 GMT+0000 (UTC)
published: Sun Apr 25 2021 17:43:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト