单细胞RNA-seq数据分析最佳实践(上)Pre-processing and visualization Normalization 计数矩阵中的每个计数代表细胞 mRNA 分⼦的成功捕获、逆转录和测序(框 1)。由于每个步骤固有的变异性,相同细胞的计数深度结果却可能不同。因此,当基于计数数据⽐较细胞间的基因表达时,任何差异可能仅由采样效应( sampling ...
特别是对于包含许多集群的大型数据集,目前的最佳实践是两种方法的组合。为了提高处理速度,自动化的细胞识别注释可以用于粗略标记细胞和识别可能的子簇。随后,应对数据集簇计算标记基因,并与来自参考数据集或文献的已知标记基因集进行比较。对于较小的数据集和缺少参考图谱的数据集,手动注释即可。 问题和建议: ·不要使用...
首先,为了便于理解数据预处理时各个步骤的作用,有必要大致介绍一下单细胞RNA测序的过程,以及获得的原始数据相对于普通转录组分析的特点。 单细胞RNA测序(scRNA-seq):一种在细胞层面解析基因表达的技术,提供了前所未有的生物学系统解析能力。 创新意义:scRNA-seq技术揭示了细胞异质性,使得以前未知的细胞群体得以发现。
single cell RNA-seq 提高了基因表达研究的分辨率,这项技术也带来越来越多的单细胞分析方法。这使得研究者难以驾驭这一多工具格局并从中搭建最新的工作流程来分析自己的数据。在这里,我们详细介绍了典型的单细胞 RNA-seq 数据分析步骤,包括预处理(质量控制、标准化、数据校正、特征选择和降维)以及细胞及基因水平的下游...
批量RNA-Seq或得细胞平均表达谱,这通常更容易下游分析,但也隐藏了一些复杂性,如细胞表达谱的异质性。一些药物或扰动可能只影响特定的细胞类型或细胞类型之间的相互作用。例如,在肿瘤学中,可能有罕见的耐药肿瘤细胞导致复发,即使在培养的细胞上,也很难通过简单的批量RNA-seq进行鉴定。
单细胞RNA-seq数据分析最佳实践(上) Pre-processing and visualization Normalization 计数矩阵中的每个计数代表细胞 mRNA 分子的成功捕获、逆转录和测序(框 1)。由于每个步骤固有的变异性,相同细胞的计数深度结果却可能不同。因此,当基于计数数据比较细胞间的基因表达时,任何差异可能仅由采样效应( sampling effects.)引...
已经成为Scanpy和Seurat单细胞分析平台中默认聚类的方法。已有研究表明,它在单细胞RNA- seq数据聚类方面优于其他聚类方法(Duo ' et al, 2018;(Freytag et al, 2018)。 从概念上讲,Louvain 算法将社区检测为一组单元,它们之间的链接比从单元的总链接数预期的要多。优化的模块功能包含一个解析参数,允许用户确定...
由于基于液滴的scRNA-seq数据集中存在大量空液滴,因此可以通过空液滴建模分析细胞悬液中的RNA构成和丰度来校正这一影响。最近开发的SoupX使用这种方法直接校正count matrix。另外,在下游分析中直接忽略这些有强影响的输入型基因也是处理这个问题的一个实用方法。
比如在分析bulk RNA-seq数据DEG分析时候用到的edgeR要就输入的就是raw count。在应用表达式恢复时,应考虑到没有一种方法是完美的。因此,任何方法都可能对数据中的噪声进行过高或过低的校正。实际上,由于表达恢复,已经报道了错误的相关信号(A...
描述设计单细胞RNA-seq实验的最佳实践 描述单细胞RNA-seq分析的工作流程步骤 使用Seurat和相关工具来执行单细胞表达数据的分析,包括数据过滤,QC,整合(降维),聚类和标记识别 为什么要学习single-cell RNA-seq 在整个人体组织中,细胞类型、状态和相互作用是非常多种多样的,为了更好的了解这些组织和存在的细胞类型,我们需...