处理这个表格拿到 基因id与KEGG通路以及GO通路对应关系: 代码语言:javascript 复制 ##GO数据库 go2gene<-list()#KEGG数据库 kegg2gene<-list()for(iin1:nrow(data)){#i<-1geneid<-data$gene_id[i]# go term temp<-unlist(str_split(data$GO[i],pattern=";"))temp<-str_split(temp,pattern="\\(...
dat[1:4,1:4]library(hgu133plus2.db)ids=toTable(hgu133plus2SYMBOL)#toTable这个函数:通过看hgu133plus2.db这个包的说明书知道提取probe_id(探针名)和symbol(基因名)的对应关系的表达矩阵的函数为toTablehead(ids)#head为查看前六行 dat=dat[ids$probe_id,]#ids提取出probe_id这列,这列的每行都为一...
可获取),第一部分就是介绍程序在哪儿写,在哪儿运行,怎么运行。(最开始学习perl,在研一时在QQ群一...
y=y)) +geom_boxplot() + theme_bw(base_size = 16) + stat_summary(fun.y=self_fun, ...
这个GEO数据集只有一个GPL平台,所以下载到的是一个含有一个元素的lista=gset[[1]]#dat=exprs(a)#a现在是一个对象,取a这个对象通过看说明书知道要用exprs这个函数dim(dat)#看一下dat这个矩阵的维度dat<-log2(dat+1)dat[1:4,1:4]#查看dat这个矩阵的1至4行和1至4列,逗号前为行,逗号后为列boxplot(...
略微思考了一下,猜测应该是这个select函数名字太大众了,所以在很多包里面都有,出现了冲突! 搜索看看select函数来自于哪里 可以看到优先级最高多的是dplyr包: 代码语言:javascript 代码运行次数:0 复制 Cloud Studio代码运行 Help on topic'select'was foundinthe following packages:Subset columns using their names ...
我们在做GO/Pathway富集分析的时候,是首先判断差异表达基因,然后再看差异表达的基因所参与的功能;而GSEA分析则根据一组基因的整体表达趋势来看该组基因是否有差异。常规的GO/Pathway分析是这样:先从10000个基因中找到差异基因800个(倍数>1.5倍),然后再分析功能;而GSEA则把10000个基因全部放进来,不管差异倍数是1.5还是...