標準の大きなモデルと対応する事前トレーニング済みの重みを使用した、自然画像データセット、特にImageNetからの転送学習は、医療画像処理への深層学習アプリケーションの事実上の方法になりました。ただし、自然画像の分類と対象の医療タスクとの間には、データサイズ、機能、およびタスク仕様に根本的な違いがあり、転送の影響についてはほとんど理解されていません。この論文では、医用画像のための転移学習の特性を探ります。 2つの大規模な医療画像処理タスクのパフォーマンス評価は、驚くべきことに、転送はパフォーマンスにほとんどメリットをもたらさず、シンプルで軽量なモデルはImageNetアーキテクチャと同等に実行できることを示しています。学習した表現と機能を調べると、転移学習との違いの一部は、高度な機能の再利用ではなく、標準モデルの過剰パラメーター化によるものであることがわかります。便利な機能の再利用が発生する場所を特定し、より効率的なモデル探索の意味を概説します。また、重量のスケーリングから生じる転送の機能に依存しない利点も検討します。
Transfer learning from natural image datasets, particularly ImageNet, using standard large models and corresponding pretrained weights has become a de-facto method for deep learning applications to medical imaging. However, there are fundamental differences in data sizes, features and task specifications between natural image classification and the target medical tasks, and there is little understanding of the effects of transfer. In this paper, we explore properties of transfer learning for medical imaging. A performance evaluation on two large scale medical imaging tasks shows that surprisingly, transfer offers little benefit to performance, and simple, lightweight models can perform comparably to ImageNet architectures. Investigating the learned representations and features, we find that some of the differences from transfer learning are due to the over-parametrization of standard models rather than sophisticated feature reuse. We isolate where useful feature reuse occurs, and outline the implications for more efficient model exploration. We also explore feature independent benefits of transfer arising from weight scalings.