第二种方法是Seurat官网极度推荐的,主要由于方法一的Normalization and variance stabilization流程存在一定问题,会造成基因表达量会与测序深度存在明显的相关关系等,因此提出了SCTransform进行预处理,然后再整合,其实后面的整合方法跟方法一的类型,只不过这里的前期预处理用的是SCTransform,而方法一用的是LogNormalize,因此整合...
scRNA-seq 数据的解释需要有效的预处理和标准化,以消除这种技术变异性。 本文[1]介绍了一个建模框架,用于对 scRNA-seq 实验中的分子计数数据进行标准化和方差稳定。该过程省略了对启发式步骤的需要,包括伪计数加法或对数转换,并改进了常见的下游分析任务,例如降维和差异表达。我们将此方法命名为 sctransform。 library...
wrap_plots(plots = plots, ncol = 1) 2 使用 SCTransform 归一化的数据集执行整合 在Hafemeister and Satija, 2019文章中,我们引入了一种基于正则化负二项式回归的 scRNA-seq normalization 的改进方法。该方法名为 'sctransform',避免了标准归一化工作流程的一些缺陷,包括添加伪计数和对数转换。您可以在manuscript...
scRNA-seq 数据的解释需要有效的预处理和标准化,以消除这种技术变异性。 本文[1]介绍了一个建模框架,用于对 scRNA-seq 实验中的分子计数数据进行标准化和方差稳定。该过程省略了对启发式步骤的需要,包括伪计数加法或对数转换,并改进了常见的下游分析任务,例如降维和差异表达。我们将此方法命名为 sctransform。 代码语...
单细胞RNA-seq数据中的生物异质性经常受技术因素(包括测序深度)影响。每个细胞中检测到的分子数量在细胞之间可能显著变化,即使在相同的细胞类型内也是如此。对 scRNA-seq 数据的解释需要有效的预处理和标准化才能消除这种技术差异。 在此教程中,我们演示了使用基于标准化的sctransform,能够得到log后较清晰的生物学差异。
如论文中所述,sctransform使用“正则化负二项式回归”计算scRNA-seq数据中的技术噪声模型。该模型的残差是归一化数值,可以是正值也可以是负值。给定细胞中给定基因的正残差表明,鉴于该基因在细胞群中的平均表达和细胞测序深度,我们观察到的UMI比预期的多,而负残差则表明相反。
Seurat 4.0 | 单细胞转录组数据整合(scRNA-seq integration) 对于两个或多个单细胞数据集的整合问题,Seurat 自带一系列方法用于跨数据集匹配(match) (或“对齐” ,align)共享的细胞群。这些方法首先识别处于匹配生物状态的交叉数据集细胞(“锚”,anchors),可以用于校正数据集之间的技术差异(如,批次效应校正),也可以...
通过基因表达数据执行的预处理步骤类似于传统的 scRNA-seq 。首先需要使数据标准化,以便较少数据之间测序深度的差异。分子计数/点的差异对于空间数据集来说可能很大,特别是如果整个组织的细胞密度存在差异。在这里看到巨大的异质性,这需要有效的标准化。 plot1 <- VlnPlot(brain, features ="nCount_Spatial", pt.si...
单细胞RNA-seq数据中的生物异质性经常受技术因素(包括测序深度)影响。每个细胞中检测到的分子数量在细胞之间可能显著变化,即使在相同的细胞类型内也是如此。对 scRNA-seq 数据的解释需要有效的预处理和标准化才能消除这种技术差异。 在此教程中,我们演示了使用基于标准化的sctransform,能够得到log后较清晰的生物学差异。
可以看到,这个时候我们选择了SCTransform函数,而且是可视化了harmony整合前后效果,如下所示: 可以很清晰的看到,如果是不使用harmony整合就是上面的UMAP的二维可视化图,那么两个样品的t和b淋巴细胞其实是可以勉强融合在一起的,但是髓系淋巴细胞就差很远了。但是下面的UMAP的二维可视化图可以看到harmony整合后确实是髓系淋巴...