arXiv reaDer
RxRx1: 実験的なバッチ修正方法を評価するためのデータセット
RxRx1: A Dataset for Evaluating Experimental Batch Correction Methods
ハイスループットスクリーニング技術は、生物学の多くの分野で大量のデータを取得するために一般的に使用されています。このような画面内のさまざまな実験バッチの技術的実行の変動性から生じるアーティファクトがこれらの観察を混乱させ、無効な生物学的結論につながる可能性があることはよく知られています。したがって、結果を分析する際には、これらのバッチ効果を考慮する必要があります。この論文では、バッチ効果補正法の体系的な研究のために特別に設計された生物学的データセットである RxRx1 について説明します。このデータセットは、4 つの細胞タイプにわたる 51 の実験バッチで 1,138 の遺伝的摂動下にあるヒト細胞の 125,510 の高解像度蛍光顕微鏡画像で構成されています。画像だけを目視検査するだけでも、重要なバッチ効果が明確に示されます。これらの画像に対する実験的なバッチ補正方法の有効性を評価し、このタスクに対する多くの補正方法のパフォーマンスを調べるように設計された分類タスクを提案します。 RxRx1 をリリースする私たちの目標は、目に見えない実験バッチにうまく一般化する効果的な実験バッチ修正方法の開発を促進することです。データセットは https://rxrx.ai でダウンロードできます。
High-throughput screening techniques are commonly used to obtain large quantities of data in many fields of biology. It is well known that artifacts arising from variability in the technical execution of different experimental batches within such screens confound these observations and can lead to invalid biological conclusions. It is therefore necessary to account for these batch effects when analyzing outcomes. In this paper we describe RxRx1, a biological dataset designed specifically for the systematic study of batch effect correction methods. The dataset consists of 125,510 high-resolution fluorescence microscopy images of human cells under 1,138 genetic perturbations in 51 experimental batches across 4 cell types. Visual inspection of the images alone clearly demonstrates significant batch effects. We propose a classification task designed to evaluate the effectiveness of experimental batch correction methods on these images and examine the performance of a number of correction methods on this task. Our goal in releasing RxRx1 is to encourage the development of effective experimental batch correction methods that generalize well to unseen experimental batches. The dataset can be downloaded at https://rxrx.ai.
updated: Fri Jan 13 2023 21:49:12 GMT+0000 (UTC)
published: Fri Jan 13 2023 21:49:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト