func_anno__id__col:基因注释文件中基因id的列名 func_anno__gene__col:基因注释文件中gene_symbol...
视频介绍GEO数据库多数据集差异分析整合利器,再也不用纠结去除批次效应--RobustRankAggreg(RRA),持续...
ID:是指探针的编号 probeset_id:表达集的探针编号 seqname:染色体名称 strand:是指正列还是负列 start:起始位置 stop:终止位置 total_probes:总的探针数目 gene_assignment:基因的描述 mrna_assignment:mrna的描述 swissprot:蛋白数据库的描述 category:种类 spot_ID:spot格式的ID Data table:就是所有的详细数据 Tot...
ID:是指探针的编号 probeset_id:表达集的探针编号 seqname:染色体名称 strand:是指正列还是负列 start:起始位置 stop:终止位置 total_probes:总的探针数目 gene_assignment:基因的描述 mrna_assignment:mrna的描述 swissprot:蛋白数据库的描述 category:种类 spot_ID:spot格式的ID Data table:就是所有的详细数据 Tot...
## 它是“ID SPOT_ID CONTROL_TYPE ENSEMBL_ID ACCESSION_STRING CHROMOSOMAL_LOCATION SPOT_ID SEQUENCE”所在行的上一行的行数!!! ## skip = 489的意思是忽略我们所需数据列名上方的所有内容library(dplyr) ### 下面开始选取想要的两列:一列是ID,一列是Sequence gpl <- gpl[,c(1,8)] # 因为ID和Seque...
!platform_table_beginID Reporter Name miRNA_ID SPOT_ID272 hsa-miR-99b-5p MIMAT0000689 271 hsa-miR-99b-3p MIMAT0004678 270 hsa-miR-99a-5p MIMAT0000097 269 hsa-miR-99a-3p MIMAT0004511 268 hsa-miR-98-5p MIMAT0000096...!platform_ta...
colnames(id_pre)#[1] "ID" "SPOT_ID"# [3] "CONTROL_TYPE" "REFSEQ"# [5] "GB_ACC" "GENE"# [7] "GENE_SYMBOL" "GENE_NAME"# [9] "UNIGENE_ID" "ENSEMBL_ID"#[11] "TIGR_ID" "ACCESSION_STRING"#[13] "CHROMOSOMAL_LOCATION" "CYTOBAND"#[15] "DESCRIPTION" "GO_ID"#[17] "SEQUENC...
library(stringr)b$gene=str_split(b$SPOT_ID,'//',simplify = T)[,3] 这样用“//”分割之后,发现gene列里我们要的symbol仍然困在括号里,然后用正则表达式去提取括号里的gene symbol: pattern <- ".*\\((?<ID>[A-Za-z0-...
library(stringr)b$gene=str_split(b$SPOT_ID,'//',simplify=T)[,3] 这样用“//”分割之后,发现gene列里我们要的symbol仍然困在括号里,然后用正则表达式去提取括号里的gene symbol: pattern<-".*\\((?<ID>[A-Za-z0-9]*)\\),.*"res<-stringr::str_match(string=b$gene,pattern=pattern)geneID...
!platform_table_beginID Reporter Name miRNA_ID SPOT_ID272 hsa-miR-99b-5p MIMAT0000689 271 hsa-miR-99b-3p MIMAT0004678 270 hsa-miR-99a-5p MIMAT0000097 269 hsa-miR-99a-3p MIMAT0004511 268 hsa-miR-98-5p MIMAT0000096...!platform_table_end ...