arXiv reaDer
データは調整可能ですか?原理的かつ解釈可能なアライメントテストと単一セルデータの統合
Is your data alignable? Principled and interpretable alignability testing and integration of single-cell data
単一細胞データの統合により、細胞の包括的な分子ビューが提供され、望ましくない技術的または生物学的変動を除去し、異種の単一細胞データセットを統合するための多くのアルゴリズムが開発されています。広く使用されているにもかかわらず、既存の方法にはいくつかの基本的な制限があります。特に、2 つの高次元単一細胞データセットが整列可能かどうか (したがって整列すべきであるかどうか) についての厳密な統計テストが不足しています。さらに、一般的な方法ではアライメント中にデータが大幅に歪む可能性があり、アライメントされたデータと下流の分析の解釈が困難になります。これらの制限を克服するために、我々はスペクトル多様体アラインメントと推論 (SMAI) フレームワークを提案します。これにより、原理的かつ解釈可能なアライメント性テストと単一細胞データの構造を保持した統合が可能になります。 SMAI は、誤解を招く推論を回避するためにデータセット間の整合性を確実に判断する統計テストを提供し、高次元の統計理論によって正当化されます。さまざまな実際およびシミュレートされたベンチマーク データセット上で、一般的に使用される位置合わせ方法よりも優れたパフォーマンスを発揮します。さらに、SMAI が差次的に発現する遺伝子の同定や単一細胞の空間トランスクリプトミクスの代入などのさまざまな下流解析を改善し、さらなる生物学的洞察を提供することを示します。 SMAI の解釈可能性により、単一細胞データにおける技術的交絡因子の発生源を定量化し、より深く理解することも可能になります。
Single-cell data integration can provide a comprehensive molecular view of cells, and many algorithms have been developed to remove unwanted technical or biological variations and integrate heterogeneous single-cell datasets. Despite their wide usage, existing methods suffer from several fundamental limitations. In particular, we lack a rigorous statistical test for whether two high-dimensional single-cell datasets are alignable (and therefore should even be aligned). Moreover, popular methods can substantially distort the data during alignment, making the aligned data and downstream analysis difficult to interpret. To overcome these limitations, we present a spectral manifold alignment and inference (SMAI) framework, which enables principled and interpretable alignability testing and structure-preserving integration of single-cell data. SMAI provides a statistical test to robustly determine the alignability between datasets to avoid misleading inference, and is justified by high-dimensional statistical theory. On a diverse range of real and simulated benchmark datasets, it outperforms commonly used alignment methods. Moreover, we show that SMAI improves various downstream analyses such as identification of differentially expressed genes and imputation of single-cell spatial transcriptomics, providing further biological insights. SMAI's interpretability also enables quantification and a deeper understanding of the sources of technical confounders in single-cell data.
updated: Thu Aug 03 2023 16:04:14 GMT+0000 (UTC)
published: Thu Aug 03 2023 16:04:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト