wgethttps://gdc-hub.s3.us-east-1.amazonaws.com/download/gencode.v22.annotation.gene.probeMap 4.代码展示 #表达矩阵 expr<-read.table("TCGA-KIRC.tsv",header=T,sep="\t",row.names=1) #ID和Gene symbol对应列表 geneann<-read.table("gencode.v22.annotation.gene.probeMap",header=T,sep="\...
toType为输出ID的类别,这里选择"SYMBOL"(如:Hoxc13),"ENSEMBL"(如:ENSMUST00000001700),"ENTREZID"(如:15422)。 fromType和toType都可以选择其他Type,如 ACCNUM, ALIAS, ENSEMBL, ENSEMBLPROT, ENSEMBLTRANS, ENTREZID, ENZYME, EVIDENCE, EVIDENCEALL, GENENAME, GO, GOALL, IPI, MGI, ONTOLOGY, ONTOLOGYALL...
将probeID转换为genesymbol 将probeID转换为gene symbol通常需要一个注释文件,这个文件包含了probeID和gene symbol之间的对应关系。这个注释文件通常可以从芯片制造商的网站或者公共数据库中获取。 以下是一个简单的Python脚本,它使用pandas库来进行转换: 代码语言:javascript 复制 import pandas as pd # 加载注释文件 an...
究其原因就是GEO数据库的数据参差不齐,不能确定上传者是否对整理好的数据进行了标准化处理。
start = response.text.find("Gene ID: ")#替换此处查找的文本可以实现Gene symbol、Gene type等转换 end = response.text.find(", updated on") if start != -1 & end != -1: gid = response.text[start + 9:end] print(gid) ids += gid + '\n' ...
4.代码展示 #表达矩阵 expr<-read.table("TCGA-KIRC.tsv",header=T,sep="\t",row.names=1) #ID和Gene symbol对应列表 geneann<-read.table("gencode.v22.annotation.gene.probeMap",header=T,sep="\t",row.names=1) #二者ID进行匹配,并添加一列gsym ...
04 代码展示 #表达矩阵expr<-read.table("TCGA-KIRC.tsv",header=T,sep="\t",row.names=1) #ID和Gene symbol对应列表geneann<-read.table("gencode.v22.annotation.gene.probeMap",header=T,sep="\t",row.names=1) #二者ID进行匹配,并添加一列gsymexpr$gsym<-geneann[rownames(expr),]$gene#去除...
04 代码展示 #表达矩阵expr<-read.table("TCGA-KIRC.tsv",header=T,sep="\t",row.names=1) #ID和Gene symbol对应列表geneann<-read.table("gencode.v22.annotation.gene.probeMap",header=T,sep="\t",row.names=1) #二者ID进行匹配,并添加一列gsymexpr$gsym<-geneann[rownames(expr),]$gene#去除...
toType为输出ID的类别,这里选择"SYMBOL"(如:Hoxc13),"ENSEMBL"(如:ENSMUST00000001700),"ENTREZID"(如:15422)。 fromType和toType都可以选择其他Type,如 ACCNUM, ALIAS, ENSEMBL, ENSEMBLPROT, ENSEMBLTRANS, ENTREZID, ENZYME, EVIDENCE, EVIDENCEALL, GENENAME, GO, GOALL, IPI, MGI, ONTOLOGY, ONTOLOGYALL...