在后面GSEA、ssGSEA、GSVA的详细介绍中,对于这种阶梯式的step function,被描述为random walk,也就是随机游走,随机游走也是一个统计学概念,在这里,我们考虑一个点从原点出发向右行走,当遇到抽样分布的样本点(数据点)时(对应的横坐标),就向上走1/n,如果没遇到就平行x轴行走。在后面的GSEA、ssGSEA、GSVA...
GSVA的输入矩阵:列是样本、行是基因、单元格内是表达量【没有差异分析!】 ssGSEA 它名字长得像GSEA,其实是GSVA的好兄弟,因为(single sample GSEA)人如其名,都单样本了还怎么做差异分析呢?没有差异分析怎么做GSEA呢? 所以ssGSEA就是单样本的GSVA GO/KEGG的输入矩阵:它们连read counts都不要!只用提供基因名!
而GSEA分析中出现了关注的通路不显著的情况,可以考虑1. 采用P.value而非Q.value(如果P.value显著的话);2. 更换基因排序方法;3. 更改基因集中基因最小数据和最大数据也会影响统计检验的结果;4. 更换需要分析的数据库或者使用自定义的功能注释基因集进行分析,方法详见GSEA富集分析实用指南。 总的来说,富集分析是...
GSVA(基因集表达解码)与GSEA类似,但重点在于非参数估计,使用了非参数分布来估计基因集在样本集中的表达趋势,而不依赖于单个样本的精确表达值。这种方法可以避免传统富集分析方法中的数据分布假设,更加灵活地处理大规模基因集。ssGSEA(标准化基因集富集分析)是对GSEA的改进,引入了标准化过程来调整基因...
TCGA转录组差异分析后多种基因功能富集分析:从GO/KEGG到GSEA和GSVA/ssGSEA(含基因ID转换)新用户3677sdB0 2021-07-16 TCGA转录组数据在完成差异分析后,我们通常希望系统地获取这些成百上千的差异基因的功能信息,帮助我们分析下游实验的思路。面对大量的差异基因,逐个查询基因功能是不切实际的。所以我们需要借助基因...
method = "ssgsea", kcdf = kcdf, ssgsea.norm = F, parallel.sz = ncores, verbose = F) } gc() } @@ -1766,12 +1779,28 @@ irGSEA.score <- function(object = NULL, assay = NULL, slot = "data", h.gsets.list.GSVA <- h.gsets.list %>% purrr::discard(.p = function(x)...
ssGSEA是为无重复的样本进行geneset enrichment analysis准备的,所以不同于上方以组别为单位(cancer vs normal)的GSEA分析,通过ssGSEA,每个样本都可以得到相应基因集的评分。GSVA的原理和作用类似,所以GSVA和ssGSEA被写入了同一个R包中,性能等同。 所以我们甚至可以对每个样本的pathway scores进行差异分析,从而获得组间...
若检验结果显著,则可说明差异基因可能参与了这一基因集所注释的生物功能,为我们的下游研究提供了系统精准的思路。目前常用的基因富集分析方法有超几何检验富集分析、Gene Set Enrichment Analysis (GSEA)和Gene Set Variation Analysis (GSVA) (或功能类似的single sample Gene Set Enrichment Analysis (ssGSEA))。
ssGSEA是为无重复的样本进行geneset enrichment analysis准备的,所以不同于上方以组别为单位(cancer vs normal)的GSEA分析,通过ssGSEA,每个样本都可以得到相应基因集的评分。GSVA的原理和作用类似,所以GSVA和ssGSEA被写入了同一个R包中,性能等同。 所以我们甚至可以对每个样本的pathway scores进行差异分析,从而获得组间...
ssGSEA是为无重复的样本进行geneset enrichment analysis准备的,所以不同于上方以组别为单位(cancer vs normal)的GSEA分析,通过ssGSEA,每个样本都可以得到相应基因集的评分。GSVA的原理和作用类似,所以GSVA和ssGSEA被写入了同一个R包中,性能等同。 所以我们甚至可以对每个样本的pathway scores进行差异分析,从而获得组间...