一般分析芯片数据都需要把探针的ID切换成基因的ID,我一般喜欢用基因的entrez ID。 一般有三种方法可以得到芯片探针与gene的对应关系。 金标准当然是去基因芯片的厂商的官网直接去下载啦!!! 一种是直接用bioconductor的包 一种是从NCBI里面下载文件来解析好! 首先,我们说官网,肯定可以找到,不然这种芯片出来就没有意义...
所以我接下来要讲的是用R的bioconductor包来批量得到芯片探针与gene的对应关系! 一般重要的芯片在R的bioconductor里面都是有包的,用一个R包可以批量获取有注释信息的芯片平台,我选取了常见的物种,如下: gpl organism bioc_package 1 GPL32 Mus musculus mgu74a 2 GPL33 Mus musculus mgu74b 3 GPL34 Mus musculus...