arXiv reaDer
不均一拡散凝縮によるデータの粗視化
Coarse Graining of Data via Inhomogeneous Diffusion Condensation
 多くの場合、ビッグデータには複数の抽象化レベルに存在する出現構造があり、観測の複雑な相互作用とダイナミクスを特徴付けるのに役立ちます。ここでは、異なる粒度でのデータポイントの多重解像度ジオメトリによる複数レベルの抽象化を検討します。このジオメトリを構築するために、データポイントを効果的に凝縮して、より大きな粒度でネストされたグループを明らかにする時間不均一な拡散プロセスを定義します。この不均一なプロセスは、データアフィニティグラフ上に固有のローパスフィルターの深いカスケードを作成し、順次適用されることで、局所的な変動を徐々に排除しながら、学習したデータジオメトリをより粗い解像度に調整します。私たちは、各段階で排除された変動の方向が強調表示された、連続的な階層的クラスタリングとして手法を示す視覚化を提供します。アルゴリズムの有用性は、構築された多重解像度データジオメトリがニューロン間の組織、グループ化、および接続性を明らかにする、ニューロンデータの凝縮を介して実証されます。
Big data often has emergent structure that exists at multiple levels of abstraction, which are useful for characterizing complex interactions and dynamics of the observations. Here, we consider multiple levels of abstraction via a multiresolution geometry of data points at different granularities. To construct this geometry we define a time-inhomogeneous diffusion process that effectively condenses data points together to uncover nested groupings at larger and larger granularities. This inhomogeneous process creates a deep cascade of intrinsic low pass filters on the data affinity graph that are applied in sequence to gradually eliminate local variability while adjusting the learned data geometry to increasingly coarser resolutions. We provide visualizations to exhibit our method as a continuously-hierarchical clustering with directions of eliminated variation highlighted at each step. The utility of our algorithm is demonstrated via neuronal data condensation, where the constructed multiresolution data geometry uncovers the organization, grouping, and connectivity between neurons.
updated: Mon Mar 09 2020 20:12:26 GMT+0000 (UTC)
published: Wed Jul 10 2019 00:08:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト