表达谱数据中相同基因如何处理 在分析表达谱芯⽚的时候,我们经常会遇到多个探针对应同⼀个基因的情况。⼀般遇到这种情况,最常见的两种处理⽅法是 1)取平均 2)取表达值⾼的那个探针 那么今天我们就⽤R来实现这两种处理⽅式。⾄于,如何将探针转换成相应的基因名字,相对来说还是⽐较容易的。⼀...
在分析表达谱芯片的时候,我们经常会遇到多个探针对应同一个基因的情况。一般遇到这种情况,最常见的两种处理方法是 1)取平均 2)取表达值高的那个探针 那么今天我们就用R来实现这两种处理方式。至于,如何将探针转换成相应的基因名字,相对来说还是比较容易的。一般的芯片数据都会有一个相应的注释文件,从中可以找到探针对...
expr_max=aggregate(.~genes,max,data=expr)expr_max 原始数据 处理之后的数据 所以这个做法不可取。 对于相同的基因,我们应该挑选行平均值大的那一整行,而不应该打乱。 代码语言:javascript 复制 #计算行平均值,按降序排列 index=order(rowMeans(expr[,-1]),decreasing=T)#调整表达谱的基因顺序 expr_ordered=...
首先我们先来随便造一个基因名有重复的表达谱数据。 #设置随机过程的seed,保证结果可重复set.seed(123)#随机生成一个30行10列的矩阵expr=matrix(runif(300,5,10),ncol=10)#列名字为sample1-10colnames(expr)=paste0("sample",1:10)#行名从26个大写字母里面有放回的抽取30个字母,作为基因名genes=sample(LE...