arXiv reaDer
大規模電子顕微鏡画像ボリュームにおけるパターン発見のための教師なし学習による潜在的特徴表現
Latent Feature Representation via Unsupervised Learning for Pattern Discovery in Massive Electron Microscopy Image Volumes
新しい大規模なデータセットの探索と分析を容易にする方法を提案します。特に、データセットの意味的類似性をキャプチャする潜在表現を学習するための教師なし深層学習アプローチを提供します。中心的なアイデアは、意味的意味を保持するデータ拡張を使用して、特徴表現が互いに近くなければならない要素の合成例を生成することです。動物の脳の比較的小さな部分でさえテラバイトの画像データを必要とする可能性があるナノスケールの電子顕微鏡データに適用される私たちの方法の有用性を示します。教師あり手法を使用して、関心のある既知のパターンを予測および特定できますが、データの規模により、事前に知られていないパターンをマイニングおよび分析することは困難です。科学者がデータ内の興味深いパターンに気付いた場合に、パターンが一致する他の場所を提示できるように、学習した表現がクエリを有効にする機能を例で示します。また、学習した空間でのデータのクラスタリングが生物学的に意味のある区別と相関していることも示しています。最後に、視覚化ツールとソフトウェアエコシステムを紹介して、ユーザーフレンドリーなインタラクティブ分析を容易にし、興味深い生物学的パターンを明らかにします。要するに、私たちの仕事は、EM分析などのドメインで発生する、大規模なデータセットの理解と発見において可能な新しい道を開きます。
We propose a method to facilitate exploration and analysis of new large data sets. In particular, we give an unsupervised deep learning approach to learning a latent representation that captures semantic similarity in the data set. The core idea is to use data augmentations that preserve semantic meaning to generate synthetic examples of elements whose feature representations should be close to one another. We demonstrate the utility of our method applied to nano-scale electron microscopy data, where even relatively small portions of animal brains can require terabytes of image data. Although supervised methods can be used to predict and identify known patterns of interest, the scale of the data makes it difficult to mine and analyze patterns that are not known a priori. We show the ability of our learned representation to enable query by example, so that if a scientist notices an interesting pattern in the data, they can be presented with other locations with matching patterns. We also demonstrate that clustering of data in the learned space correlates with biologically-meaningful distinctions. Finally, we introduce a visualization tool and software ecosystem to facilitate user-friendly interactive analysis and uncover interesting biological patterns. In short, our work opens possible new avenues in understanding of and discovery in large data sets, arising in domains such as EM analysis.
updated: Tue Dec 22 2020 17:14:19 GMT+0000 (UTC)
published: Tue Dec 22 2020 17:14:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト