大規模な注釈付き画像データセットの利用可能性と教師ありディープラーニング手法の最近の進歩により、さまざまな画像分析問題に影響を与える可能性のある代表的な画像の特徴をエンドツーエンドで導出できます。しかし、そのような監視されたアプローチは、手動アノテーションの複雑さとラベル割り当てにおける観察者間および観察者内変動のために、大量のラベル付けされたデータを取得することが難しい医療分野で実装することは困難です。アノテーション付きのトレーニングデータが不足している医療画像分析ドメインで代表的な視覚的特徴を学習するという課題に対処する、階層的な教師なし特徴学習フレームワークである、新しい畳み込みスパースカーネルネットワーク(CSKN)を提案します。私たちのフレームワークには3つの貢献があります。(i)カーネル学習を拡張して、監視されていない方法で画像サブパッチ全体の不変の特徴を識別して表現します。 (ii)カーネル学習を、医用画像に固有のスパース性を活用して初期の識別的特徴を抽出するレイヤーごとの事前トレーニングスキームで初期化します。 (iii)マルチスケールの空間ピラミッドプーリング(SPP)フレームワークを採用して、学習した視覚的特徴間の微妙な幾何学的差異をキャプチャします。 3つのパブリックデータセットでの医療画像の検索と分類のフレームワークを評価しました。私たちの結果は、他の従来の教師なし手法と比較した場合にCSKNの精度が高く、最新の教師付き畳み込みニューラルネットワーク(CNN)を使用する手法に匹敵する精度を示した。私たちの調査結果は、私たちの教師なしCSKNが、注釈なしのビッグデータを医療画像リポジトリで活用する機会を提供することを示しています。
The availability of large-scale annotated image datasets and recent advances in supervised deep learning methods enable the end-to-end derivation of representative image features that can impact a variety of image analysis problems. Such supervised approaches, however, are difficult to implement in the medical domain where large volumes of labelled data are difficult to obtain due to the complexity of manual annotation and inter- and intra-observer variability in label assignment. We propose a new convolutional sparse kernel network (CSKN), which is a hierarchical unsupervised feature learning framework that addresses the challenge of learning representative visual features in medical image analysis domains where there is a lack of annotated training data. Our framework has three contributions: (i) We extend kernel learning to identify and represent invariant features across image sub-patches in an unsupervised manner. (ii) We initialise our kernel learning with a layer-wise pre-training scheme that leverages the sparsity inherent in medical images to extract initial discriminative features. (iii) We adapt a multi-scale spatial pyramid pooling (SPP) framework to capture subtle geometric differences between learned visual features. We evaluated our framework in medical image retrieval and classification on three public datasets. Our results show that our CSKN had better accuracy when compared to other conventional unsupervised methods and comparable accuracy to methods that used state-of-the-art supervised convolutional neural networks (CNNs). Our findings indicate that our unsupervised CSKN provides an opportunity to leverage unannotated big data in medical imaging repositories.