About Explicit Variance Minimization: Training Neural Networks for Medical Imaging With Limited Data Annotations
コンピュータビジョンの自己教師あり学習方法は、事前トレーニング機能表現の有効性を実証しており、注釈付きデータが限られている場合でも、ディープニューラルネットワークを十分に一般化できます。ただし、表現学習手法はモデルのトレーニングにかなりの時間を必要とし、ほとんどの時間は正確なハイパーパラメータの最適化と拡張手法の選択に費やされます。組織形態の保存された類似性のために医用画像で一般的であるように、注釈付きデータセットが一般集団の多様性をキャプチャするのに十分な形態学的多様性を持っている場合、訓練されたモデルの分散誤差が偏りと分散の主要な要素であると仮定しましたトレード・オフ。したがって、モデル損失関数に分散エラーを導入し、それによってモデルを明示的に正則化することにより、このデータプロパティを活用するVariance Aware Training(VAT)メソッドを提案しました。さらに、アプローチの解釈を支援するために、提案された方法の理論的定式化と証明を提供しました。私たちの方法では、1つのハイパーパラメータのみを選択し、GPUトレーニング時間の桁違いの削減を達成しながら、最先端の自己監視方法のパフォーマンスを一致または改善する必要があります。さまざまなドメインからの3つの医用画像データセットとさまざまな学習目的でVATを検証しました。これらには、心臓セマンティックセグメンテーション(MICCAI 2017 ACDCチャレンジ)の磁気共鳴画像(MRI)データセット、糖尿病性網膜症進行の通常の退行(Kaggle 2019 APTOS失明検出チャレンジ)の眼底写真データセット、およびリンパ節切片の組織病理学的スキャンの分類が含まれていました。 (PatchCamelyonデータセット)。私たちのコードはで入手できます。
Self-supervised learning methods for computer vision have demonstrated the effectiveness of pre-training feature representations, resulting in well-generalizing Deep Neural Networks, even if the annotated data are limited. However, representation learning techniques require a significant amount of time for model training, with most of the time spent on precise hyper-parameter optimization and selection of augmentation techniques. We hypothesized that if the annotated dataset has enough morphological diversity to capture the diversity of the general population, as is common in medical imaging due to conserved similarities of tissue morphology, the variance error of the trained model is the dominant component of the Bias-Variance Trade-off. Therefore, we proposed the Variance Aware Training (VAT) method that exploits this data property by introducing the variance error into the model loss function, thereby, explicitly regularizing the model. Additionally, we provided a theoretical formulation and proof of the proposed method to aid interpreting the approach. Our method requires selecting only one hyper-parameter and matching or improving the performance of state-of-the-art self-supervised methods while achieving an order of magnitude reduction in the GPU training time. We validated VAT on three medical imaging datasets from diverse domains and for various learning objectives. These included a Magnetic Resonance Imaging (MRI) dataset for the heart semantic segmentation (MICCAI 2017 ACDC challenge), fundus photography dataset for ordinary regression of diabetic retinopathy progression (Kaggle 2019 APTOS Blindness Detection challenge), and classification of histopathologic scans of lymph node sections (PatchCamelyon dataset). Our code is available at
updated: Tue Aug 24 2021 17:34:37 GMT+0000 (UTC)
published: Fri May 28 2021 21:34:04 GMT+0000 (UTC)
