arXiv reaDer
不均衡な結腸直腸癌画像分類における畳み込みニューラルネットワークトレーニングのための2段階リサンプリング
Two-Stage Resampling for Convolutional Neural Network Training in the Imbalanced Colorectal Cancer Image Classification
 データの不均衡は、依然として現代の機械学習における未解決の課題の1つです。これは、組織病理学的画像などの医療データの場合に特に一般的です。データの不均衡を処理するための従来のデータレベルのアプローチは画像データには不適切です。SMOTEやその派生物などのオーバーサンプリング手法は非現実的な合成観測の作成につながりますが、アンダーサンプリングは利用可能なデータの量を減らし、畳み込みニューラルのトレーニングを成功させるために重要ですネットワーク。オーバーサンプリングとアンダーサンプリングに関連する問題を軽減するために、新しい2段階リサンプリング手法を提案します。この方法では、最初に画像空間でオーバーサンプリング技術を使用して、畳み込みニューラルネットワークのトレーニングに大量のデータを活用し、その後適用します。ネットワークの最後のレイヤーを微調整するために、機能空間でアンダーサンプリングを行います。大腸がんの画像データセットに対して行われた実験は、提案されたアプローチの有用性を示しています。
Data imbalance remains one of the open challenges in the contemporary machine learning. It is especially prevalent in case of medical data, such as histopathological images. Traditional data-level approaches for dealing with data imbalance are ill-suited for image data: oversampling methods such as SMOTE and its derivatives lead to creation of unrealistic synthetic observations, whereas undersampling reduces the amount of available data, critical for successful training of convolutional neural networks. To alleviate the problems associated with over- and undersampling we propose a novel two-stage resampling methodology, in which we initially use the oversampling techniques in the image space to leverage a large amount of data for training of a convolutional neural network, and afterwards apply undersampling in the feature space to fine-tune the last layers of the network. Experiments conducted on a colorectal cancer image dataset indicate the usefulness of the proposed approach.
updated: Sat Apr 17 2021 13:44:04 GMT+0000 (UTC)
published: Tue Apr 07 2020 13:11:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト