通常,当根据多个条件对细胞进行聚类时,可能会存在特定于条件的聚类,而整合样本可以帮助确保相同的细胞类型聚集在一起。 为了整合,我们将使用SCTransform鉴定出的每种情况下共同的高度可变的基因,然后,我们将“整合”或“协调”这些条件,以覆盖不同群体之间相似或具有“共同生物学特征”的细胞。这些群体可以代表: 不同条...
Seurat最近介绍了一种新的scRNA-seq数据normalization and variance stabilization方法,称为sctransform。 sctransform方法使用regularized negative binomial model对UMI计数建模以去除由于测序深度(每个细胞的总nUMIs)引起的变化,同时根据具有相似丰度的基因之间的信息集合来调整方差(类似于一些批量RNA-seq方法)。 模型的输出(残...
因为老方法将一些技术性的变异源纳入了一些较高的PC,所以选择PC更重要。SCTransform能更好地估计方差,并且在较高的PC中不经常包含这些技术变异源。 理论上来说,用SCTransform,我们在进行聚类时,选择的PC越多,核算的方差就越多,但进行聚类时需要花费的时间就越长。因此在这个分析中,我们将使用前40个PC来生成聚类。
由于测序深度、测序批次等因素,生物学重复之间的读数往往会存在显著差异。因此,需要对原始计数进行归一化处理,如常用的 logNormalize 或者 SCTransform 来纠正测序深度的影响。使用SCTransform 方法校正线粒体基因含量、细胞周期等因素对下游分析的影响。 se.list <- lapply(se.list,function(se){ # Log Normalize(need...
随着高通量scRNA-seq(包括临床样本)能力的扩大,对这些海量数据的分析能力已成为进入该领域研究人员的必备技能。近日,《Military Medical Research》发表了一篇综述文章,回顾了典型scRNA-seq数据分析的工作流程,总结每个分析步骤的当前方法,并针对某些特定的分析任务
sct:表示是否使用了SCTransform方法进行标准化。 scRNA<-doubletFinder_v3(scRNA,PCs=1:15,pN=0.25,pK=pK_bcmvn,nExp=nExp_poi.adj,reuse.pANN=F,sct=T) ## 运行结果储存在scRNA@meta.data中 #可视化如图 #将双细胞剔除后生成新的对象scRNA.singlet,便于我们后续分析 ...
这种统计模型也可以用于对每个基因的方差进行归一化,以计算超出期望的残差方差(SCTransform就是干这个的)。由于方差估计是基于所有被测细胞,高可变基因会更关注最剧烈的亚群差异(例如上皮细胞vs免疫细胞),而更微妙的差异(例如CD4和CD8 T细胞)可能需要对分群进行重分析。
sctransform认为:新增加的这1000个基因就包含了之前没有检测到的微弱的生物学差异。而且,即使使用全部的全部的基因去做下游分析,得到的结果也是和 sctransform 这3000个基因的结果相似 因为SCTransform对参数的要求不是很多,一般默认参数就能应付大多数情况,因此作者也给出了单行从创建对象到最后分群的结果 ...
虽然Vallejos等人进行的模拟研究表明Scran的池化策略在缩放因子估计方面优于比较工具,但TPM-/count 深度缩放方法在实践中得到了广泛应用。为了更好地稳定方差,Seurat团队最近开发了SCTransform,它将正则化负二项回归应用于scRNA-seq数据归一化和方差稳定。 一些已知的生物效应,例如细胞周期和细胞应激(以线粒体基因的过度...
objs[[2]] <- ks_detectDoublet(objs[[2]],dims =1:15,estDubRate=0.025,ncores =2, SCTransform=F, Homotypic=F, annotation="seurat_clusters") objs[[3]] <- ks_detectDoublet(objs[[3]],dims =1:15,estDubRate=0.060,ncores =2, SCTransform=F, Homotypic=F, annotation="seurat_clusters"...