虽然其中一些方法已应用于 scRNA-seq 分析,但单细胞数据特有的变异来源如技术脱落(technical dropouts )(取样导致的零计数,双零问题)促使开发出了针对 scRNA-seq 的标准化方法 (Lun et al,2016a;Vallejos et al,2017)。 最常用的规范化协议是 count depth scaling,也称为每百万计数或 CPM 规范化。该方案来自b...
文章详细介绍了典型的单细胞 RNA-seq 数据分析步骤,包括预处理(质量控制、标准化、数据校正、特征选择和降维)以及细胞及基因水平的下游分析。 根据独立比较研究为这些步骤制定了当前(2019年)最佳实践建议,但是并没有标准化分析流程,而是概述了当前的最佳实践和独立于编程语言的通用工具。 单细胞RNA-seq数据分析最佳实践...
首先,为了便于理解数据预处理时各个步骤的作用,有必要大致介绍一下单细胞RNA测序的过程,以及获得的原始数据相对于普通转录组分析的特点。 单细胞RNA测序(scRNA-seq):一种在细胞层面解析基因表达的技术,提供了前所未有的生物学系统解析能力。 创新意义:scRNA-seq技术揭示了细胞异质性,使得以前未知的细胞群体得以发现。
通过富集试验、Jaccard 指数或其他重叠统计,比较数据集中的标记基因和参考数据集中的标记基因,可对聚类结果进行注释。引用 web 工具,如www.mousebrain.org(Zeisel et al,2018) 或http://dropviz.org/(Saunders et al,2018) 允许用户可视化参考数据集中数据集标记基因的表达,以促进细胞识别注释。 检测标记基因时应注...
图1. 典型的单细胞 RNA-seq 分析工作流程示意图。原始测序数据经过处理和比对,得到计数矩阵,代表工作流程的开始。计数矩阵经过预处理和下游分析。使用 Haber et al (2017) 肠上皮细胞数据的最佳实践工作流程生成子图。 框1:实验性scRNA-seq工作流的关键元素 ...
图1. 典型的单细胞 RNA-seq 分析工作流程示意图。原始测序数据经过处理和比对,得到计数矩阵,代表工作流程的开始。计数矩阵经过预处理和下游分析。使用 Haber et al (2017) 肠上皮细胞数据的最佳实践工作流程生成子图。 框1:实验性scRNA-seq工作流的关键元素 ...
单细胞RNA-seq数据分析最佳实践(上)Pre-processing and visualization Normalization 计数矩阵中的每个计数代表细胞 mRNA 分⼦的成功捕获、逆转录和测序(框 1)。由于每个步骤固有的变异性,相同细胞的计数深度结果却可能不同。因此,当基于计数数据⽐较细胞间的基因表达时,任何差异可能仅由采样效应( sampling ...
比如在分析bulk RNA-seq数据DEG分析时候用到的edgeR要就输入的就是raw count。在应用表达式恢复时,应考虑到没有一种方法是完美的。因此,任何方法都可能对数据中的噪声进行过高或过低的校正。实际上,由于表达恢复,已经报道了错误的相关信号(A...
由于基于液滴的scRNA-seq数据集中存在大量空液滴,因此可以通过空液滴建模分析细胞悬液中的RNA构成和丰度来校正这一影响。最近开发的SoupX使用这种方法直接校正count matrix。另外,在下游分析中直接忽略这些有强影响的输入型基因也是处理这个问题的一个实用方法。
单细胞 RNA-seq 数据 - 计数矩阵的原始数据 根据所使用的文库制备方法,RNA序列(也称为读序列或标签)将从转录本的3端(或5端)(10X Genomics, cell -seq2, Drop-seq, inDrops)或全长转录本(Smart-seq)中获得。 image 图片来源:Papalexi E 和 Satija R. 探索免疫细胞异质性的单细胞 RNA 测序,Nature Review...