Progressive Wasserstein Barycenters of Persistence Diagrams
  この論文は、アンサンブルデータの視覚分析への応用を伴う、永続図のワッサーシュタイン重心の漸進的近似のための効率的なアルゴリズムを提示します。スカラーフィールドのセットが与えられると、このアプローチにより、セットを代表し、セットで見つかった主な特徴の数、データ範囲、およびサリエンスを視覚的に伝える永続性ダイアグラムの計算が可能になります。このような代表的な図は、永続的な図のセットの離散的なWasserstein重心を明示的に計算することで得られます。これは、悪名高い計算集約的なタスクです。特に、Wasserstein距離近似[12,51]の効率的なアルゴリズムを再検討して、重心推定に関する以前の研究[94]を拡張します。新しい高速アルゴリズムを提示します。これは、計算の精度と出力図の永続的な特徴の数を繰り返し増加させることにより、重心を徐々に近似します。このような進歩性により、実際の収束が大幅に改善され、計算時間の制約を順守できる割り込み可能なアルゴリズムを設計できます。これにより、インタラクティブな時間内でのワッサーシュタイン重心の近似が可能になります。アンサンブルクラスタリングへのアプリケーションを紹介します。ここでは、k-meansアルゴリズムを再検討して重心を活用し、実行時間の制約内で、重心図とともにアンサンブルデータの意味のあるクラスターを計算します。合成および実際のデータセットに関する広範な実験により、アルゴリズムがアプリケーションに関して定性的に意味のある重心に収束し、以前の手法と定量的に匹敵する一方で、収束するまで実行すると1桁の速度向上が得られることが報告されています(時間制約なし) 。私たちのアルゴリズムは、標準のワークステーションで実際に追加の高速化を提供するために簡単に並列化できます。 [...]
This paper presents an efficient algorithm for the progressive approximation of Wasserstein barycenters of persistence diagrams, with applications to the visual analysis of ensemble data. Given a set of scalar fields, our approach enables the computation of a persistence diagram which is representative of the set, and which visually conveys the number, data ranges and saliences of the main features of interest found in the set. Such representative diagrams are obtained by computing explicitly the discrete Wasserstein barycenter of the set of persistence diagrams, a notoriously computationally intensive task. In particular, we revisit efficient algorithms for Wasserstein distance approximation [12,51] to extend previous work on barycenter estimation [94]. We present a new fast algorithm, which progressively approximates the barycenter by iteratively increasing the computation accuracy as well as the number of persistent features in the output diagram. Such a progressivity drastically improves convergence in practice and allows to design an interruptible algorithm, capable of respecting computation time constraints. This enables the approximation of Wasserstein barycenters within interactive times. We present an application to ensemble clustering where we revisit the k-means algorithm to exploit our barycenters and compute, within execution time constraints, meaningful clusters of ensemble data along with their barycenter diagram. Extensive experiments on synthetic and real-life data sets report that our algorithm converges to barycenters that are qualitatively meaningful with regard to the applications, and quantitatively comparable to previous techniques, while offering an order of magnitude speedup when run until convergence (without time constraint). Our algorithm can be trivially parallelized to provide additional speedups in practice on standard workstations. [...]
updated: Wed Oct 09 2019 16:36:24 GMT+0000 (UTC)
published: Wed Jul 10 2019 08:24:11 GMT+0000 (UTC)
