C5: GO gene sets:Gene Ontology 基因本体论,包括BP(生物学过程biological process,细胞原件cellular component和分子功能molecular function三部分),这部分,我们也是比较关注的,所以能用GSEA分析就用GSEA。 C6: oncogenic signatures:癌症特征基因集合,大部分来源于NCBI GEO 未发表芯片数据。 C7: immunologic signatures: ...
GOplotIn_BP<-GO[1:10,c(2,3,7,9)] #提取GO富集BP的前10行,提取ID,Description,p.adjust,GeneID四列 GOplotIn_CC<-GO[2103:2112,c(2,3,7,9)]#提取GO富集CC的前10行,提取ID,Description,p.adjust,GeneID四列 GOplotIn_MF<-GO[2410:2419,c(2,3,7,9)]#提取GO富集MF的前10行,提取ID,Des...
gene_symbol) #geneset_GO$gs_name <- gsub('GOBP_','',geneset_GO$gs_name)#去除前缀KEGG_ ...
awk 'BEGIN{OFS=FS="\t"}{if($8=="P") print $1,$5,$6}' ATH_GO_GOSLIM.txt | sort -u | awk 'BEGIN{OFS=FS="\t"}{anno=$2"\t"$3; a[anno]=a[anno]==""?$1:a[anno]"\t"$1}END{for(i in a) print i,a[i]}' > ATH_GO_GOSLIM_LocusName_bp_useme.gmt 1. 2. 3...
ClusterProfiler中默认的基因集大小是[10,500]。试过[30,200]的GO-BP+自定义的Null模型,还可以在个人电脑上完成。 GO和DisGeNET存在一个问题就是有很多非大脑相关的类别,如果做矫正的话,这些非大脑相关的类别可能大大降低类别过矫正的概率。另一个方面就是上面提到的,计算时间的问题。因此需要有人完成一些额外的...
2.2 GSEA-GO分析 代码语言:javascript 代码运行次数:0 运行 AI代码解释 gse.GO<-gseGO(geneList,#geneList ont="BP",# 可选"BP"、"MF"和"CC"或"ALL"OrgDb=org.Hs.eg.db,#人 注释基因 keyType="ENTREZID",pvalueCutoff=0.05,pAdjustMethod="BH",#p值校正方法)head(gse.GO,2) ...
GSEA和GO、KEGG pathway不同的地方在于,后两者会提前设定一个阈值,只关注差异变化大的基因(相当于重点班)。这样子容易遗漏部分差异表达不显著却有重要生物学意义的基因(成绩一般,但是很有天赋)。所以GSEA分析比较适用于,传统分析方法筛选后样本过少的数据集。
同样的进行GO功能注释 代码语言:javascript 代码运行次数:0 运行 AI代码解释 ##GOxx<-compareCluster(gcSample,fun="enrichGO",OrgDb="org.Hs.eg.db",ont="BP",pAdjustMethod="BH",pvalueCutoff=0.01,qvalueCutoff=0.05)p<-dotplot(xx)p+theme(axis.text.x=element_text(angle=45,vjust=0.5,hjust=0.5)...
此函数包含两个部分:KS_GSEA与KS_GSEA_plot。KS_GSEA用于执行转录组数据的GSEA分析,支持clusterProfiler和fgsea两种R包,适用于人和鼠两个物种,提供针对KEGG和GO(BP)的分析选项。KS_GSEA_plot则负责对分析结果进行可视化展示,允许用户选择感兴趣的通路进行展示。以单细胞数据为例,首先进行差异分析。
通过KEGG、GO等经典富集分析,我们能够了解到阈值筛选出的差异基因参与的通路和具备的功能,以及哪些功能/通路对表型变化是可能起主导作用的。 但在经典富集分析中,我们无法得知某条通路下差异基因的总体变化趋势,即富集到同一通路下的基因可能既有上调也有下调,那么这条通路的表现形式到底是被激活了,还是被抑制了呢?且...