KEGG(Kyoto Encyclopedia of Genes and Genomes):是一个综合的生物信息学数据库,主要关注生物通路和代谢途径。KEGG富集分析用于识别基因集中富集的生物学通路,有助于理解基因集在细胞生物学过程中的功能。 GO(Gene Ontology):是一个用于描述基因和基因功能的标准化词汇数据库。GO涵盖了生物学过程(Biological Process)、...
GSVA包,通过将输入的逐个样本的基因表达数据矩阵转换为相应的逐个样本的基因组表达数据矩阵来估计通路活性。然后,可以将此结果表达数据矩阵与经典分析方法一起使用,例如以通路为中心的方式进行差异表达、分类、生存分析、聚类或相关性分析。人们还可以在途径和其他分子数据类型之间进行样本比较,例如 microRNA 表达或结合数据...
获取KEGG通路的基因列表:这通常涉及使用专门的R包,如KEGGREST或biomaRt,来查询KEGG数据库并检索特定通路的基因列表。 准备单细胞表达数据:这包括加载单细胞RNA-seq数据,通常使用Seurat或其他单细胞分析包进行预处理。 执行GSVA分析:使用GSVA包对单细胞数据执行基因集变异分析(GSVA),根据KEGG通路的基因列表评估每个单细胞...
# keggGet(x)[[1]]$GENE 数据基因名是个向量,其中奇数位置是 entrezgene_id 偶数位置是 symbolgeneEntrez<-function(x){geneList<-keggGet(x)[[1]]$GENEif(!is.null(geneList)){listLength<-length(geneList)entrezList<-geneList[seq.int(from=1,by=2,length.out=listLength/2)]entrez<-stringr::...
GSVA(基因集变异分析)是一种非参数、无监督的方法,用于评估基因集在芯片或转录组数据中的富集。通过将基因表达数据集从一个样本矩阵转换为基因集在不同样本之间的矩阵,GSVA允许我们以通路为中心进行分析,从而在单个样本层面评估不同代谢途径的富集或变异。GSVA不同于GSEA(基因集富集分析),它不局限...
GOKEGGGSEAGSVA是一种对单细胞转录组数据进行功能注释的方法。Gene Ontology(GO)是一种对基因和蛋白质功能进行分类和注释的体系。KEGG是一个整合了生命科学领域中各种高通量分析数据的数据库,注释了基因和蛋白质在代谢通路和细胞过程中的功能。Gene Set Enrichment Analysis(GSEA)是一种用于鉴定基因集是否在给定表达数据...
ssGSEA(标准化基因集富集分析)是对GSEA的改进,引入了标准化过程来调整基因集在样本集中的分布,从而提供了一个更准确的富集度量。它通过标准化每个样本对基因集的贡献,使得不同大小的基因集能够在同一尺度上比较,解决了GSEA方法中基因集大小可能带来的偏误问题。GO(基因本体论)和KEGG(京都基因与基因...
GSVA主要是通过感兴趣的基因集来划分样本,有样本基因表达谱和一个感兴趣的基因集的情况下选GSVA 而GSEA是已知两组样本差异,看差异基因上下调关系与通路的富集关系,提供正负相关方向性 同时再来讲KEGG、GO和GSEA:在有logFC的情况下,选GSEA,无logFC选GO和KEGG。因为KEGG和GO是分析不出来是上调基因富集还是下调基因富...
GSVA基因集变异分析,是在无参数且无监督的条件下,将Microarray和RNA-seq数据基因集进行富集的分析方法。GSVA能将一个基因-样本的数据矩阵(microarray data, FPKM, RPKM等)转换成基因集-样本矩阵。基于该矩阵可以进一步分析各个样本中基因集(如KEGG通路)的富集情况。由于GSVA的结果为一个基因集-样本的富集矩阵,相比其它...
生信分析的文章中一般都会做“富集分析” 大家最常见到的、也是最基础的就是GO和KEGG富集分析,除了它俩,我们还可以见到GSEA和GSVA ~ ~ GSEA和GSVA长得如此像,你知道它俩分别都是干啥的吗?能分清楚怎么用这两个分析吗? 跟着小云一起来学习啦,争取看完这篇就搞清楚它!