arXiv reaDer
Exploiting generative self-supervised learning for the assessment of biological images with lack of annotations: a COVID-19 case-study
生物学的画像のコンピューター支援分析は、通常、大規模な注釈付きデータセットに関する広範なトレーニングを必要としますが、これは多くの状況で実行可能ではありません。この論文では、StyleGAN2アーキテクチャに基づく弁別学習器であるGAN-DLを紹介します。これは、蛍光生物学的画像の場合の自己教師あり画像表現学習に使用されます。線形サポートベクターマシンと組み合わせたWassersteinGenerative Adversarial Networksが、生画像に基づくハイスループット化合物スクリーニングを可能にすることを示します。 VEROおよびHRCE細胞株におけるSARS-CoV-2感染の阻害について試験された活性化合物と不活性化合物を分類することにより、これを実証します。以前の方法とは対照的に、ディープラーニングベースのアプローチでは、サンプル準備プロセス中に通常収集される注釈以外に注釈は必要ありません。 RxRx19aSars-CoV-2画像コレクションでテクニックをテストします。データセットは、VEROおよびHRCE細胞株の両方でSARS-CoV-2からのinvitro感染を調節する規制当局が承認したまたは後期臨床試験化合物の能力を評価するために生成された蛍光画像で構成されています。私たちの手法は、分類タスクだけでなく、自己監視方式で、テストされた治療の用量反応曲線を効果的に導出するためにも活用できることを示しています。最後に、RxRx1蛍光画像コレクションの4つの異なる細胞型の分類で構成される、ゼロショット学習タスクに正常に対処することにより、その一般化機能を示します。
Computer-aided analysis of biological images typically requires extensive training on large-scale annotated datasets, which is not viable in many situations. In this paper we present GAN-DL, a Discriminator Learner based on the StyleGAN2 architecture, which we employ for self-supervised image representation learning in the case of fluorescent biological images. We show that Wasserstein Generative Adversarial Networks combined with linear Support Vector Machines enable high-throughput compound screening based on raw images. We demonstrate this by classifying active and inactive compounds tested for the inhibition of SARS-CoV-2 infection in VERO and HRCE cell lines. In contrast to previous methods, our deep learning based approach does not require any annotation besides the one that is normally collected during the sample preparation process. We test our technique on the RxRx19a Sars-CoV-2 image collection. The dataset consists of fluorescent images that were generated to assess the ability of regulatory-approved or in late-stage clinical trials compound to modulate the in vitro infection from SARS-CoV-2 in both VERO and HRCE cell lines. We show that our technique can be exploited not only for classification tasks, but also to effectively derive a dose response curve for the tested treatments, in a self-supervised manner. Lastly, we demonstrate its generalization capabilities by successfully addressing a zero-shot learning task, consisting in the categorization of four different cell types of the RxRx1 fluorescent images collection.
updated: Fri Jul 16 2021 08:36:34 GMT+0000 (UTC)
published: Fri Jul 16 2021 08:36:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト