Learning Permutation Invariant Representations using Memory Networks
デジタル組織病理画像の分類や3Dオブジェクトの検出など、実際の多くのタスクには、一連のインスタンスからの学習が含まれます。これらの場合、インスタンスのグループまたはセットのみが集合的に意味のある情報を含むため、セットのみにラベルがあり、個別のデータインスタンスはありません。この作業では、学習セット関数用のメモリベースの交換可能モデル(MEM)と呼ばれる順列不変ニューラルネットワークを示します。 MEMモデルは、上位シーケンス機能への入力シーケンスを埋め込むメモリユニットで構成され、モデルが自己注意メカニズムを通じてインスタンス間の相互依存関係を学習できるようにします。さまざまなおもちゃのデータセット、点群分類、および肺全体スライド画像(WSI)のMEMの学習能力を、肺癌の2つのサブタイプである肺腺癌と肺扁平上皮癌に分類して評価しました。 WSIの最大のパブリックリポジトリであるThe Cancer Genome Atlas〜(TCGA)データセットからダウンロードした肺WSIからパッチを体系的に抽出し、肺癌の2つのサブタイプの分類で84.84%の競合精度を達成しました。他のデータセットの結果も有望であり、モデルの有効性を示しています。
Many real-world tasks such as classification of digital histopathology images and 3D object detection involve learning from a set of instances. In these cases, only a group of instances or a set, collectively, contains meaningful information and therefore only the sets have labels, and not individual data instances. In this work, we present a permutation invariant neural network called Memory-based Exchangeable Model (MEM) for learning set functions. The MEM model consists of memory units that embed an input sequence to high-level features enabling the model to learn inter-dependencies among instances through a self-attention mechanism. We evaluated the learning ability of MEM on various toy datasets, point cloud classification, and classification of lung whole slide images (WSIs) into two subtypes of lung cancer---Lung Adenocarcinoma, and Lung Squamous Cell Carcinoma. We systematically extracted patches from lung WSIs downloaded from The Cancer Genome Atlas~(TCGA) dataset, the largest public repository of WSIs, achieving a competitive accuracy of 84.84% for classification of two sub-types of lung cancer. The results on other datasets are promising as well, and demonstrate the efficacy of our model.
updated: Fri Jul 03 2020 16:27:23 GMT+0000 (UTC)
published: Mon Nov 18 2019 22:28:30 GMT+0000 (UTC)
