4376 2 2023-10-21 01:27:49 未经作者授权,禁止转载 77 46 187 16 3种常见的GEO转换ID方法 万物研究所 知识 科学科普 生信小白 生信基础 GEO 生信 生信分析 万物研究所·第11期 叉叉滴同学的生信笔记发消息 助力生信小白 【无马赛克完整版】被MC官方封杀的珍妮模组,居然还有隐藏BOSS!
ID_Sybmol = GPL_table[,c(1,11)] #GPL对应ID列 colnames(ID_Sybmol)[2]="Symbol" #更改名称为Symbol,主要是为了对其求平均函数 c(1,11)这里的11是GPL平台表格里面,代表第11列,小果这里GeneSymbol是11列,所以这里是11,小伙伴们需要数一下自己数据Symbol在第几列。 接下来: #合并ID与基因列 Exp = m...
probe_to_gene <- setNames(platform_file$GeneName, platform_file$ProbeID) # 将表达谱数据中的ProbeID替换为GeneName expression_data$GeneName <- probe_to_gene[expression_data$ProbeID] # 可以选择性地保存转换后的数据 write.table(expression_data, "converted_expression_data.txt", sep = "\t", q...
注意,这个方法不一定可以将全部的ID转化成gene symbol # 首先打开这两个R包library(clusterProfiler)library(org.Hs.eg.db)# 如果没有这两个R包,就运下面的代码进行下载#if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)# options(BioC_mirror="https://mirrors.ustc.edu.cn...
GEO数据库-ID转换系列(一) 作者:jzhang 前言:我们都知道很多人在进行GEO数据库挖掘的时候,首先遇到的第一个痛点就是探针ID转换成gene symbol的问题,...
1. 提取基因标志 2. ID转换 3. 合并基因 正要解决这个问题,方案不一定百分百对,但用于分析应该足够...
正式进行探针ID之间的转换 我们现在用的是矩阵文件exprSet, 我们要达到的效果是这个样的 其实很简单,就是把两个数据框按照探针名称合并就可以了, 同时在这里,我们还需要把重复的探针去掉,方法就是计算每一个探针的平均值,留下最大的那个。 先调整两个数据框的探针名字和类型,方便合并 ...
然后正式开始ID转换, exprSet=a1 table(rownames(exprSet)%in%ids$probe_id)dim(exprSet)exprSet=exprSet[rownames(exprSet)%in%ids$probe_id,]#过滤dim(exprSet)ids=ids[match(rownames(exprSet),ids$probe_id),]#改变探针顺序head(ids)exprSet[1:5,1:5] ...
2.芯片平台:不同芯片公司使用不同芯片平台,不同芯片以GPL字母开头,不同芯片平台包含不同的探针和基因ID对应关系,所以芯片数据预处理时,需要将探针ID转换为对应的基因,称为“探针ID转换”。3.样本,这里直接给出某个数据集的样本量。 然后点开数据集边上的小三角,就展开这个数据集的详细介绍,包括标题,五中,实验...
整理好了表达矩阵以后,我们需要将探针的id转换成为基因的Gene symbol。对于探针id的转换过程,目前主要是通过R包来进行转换。接下来,我们来看一下如何进行芯片探针id的转换过程。 方法一:使用R包转换 随着芯片平台的普遍使用,其基因的注释信息也被整理成了不同的R包;因此,通常情况下我们使用R包来注释。不同的平台,...