填充时根据基因在样本内的排序位置,从行均值里面找到对应行的值做为基因的表达值,如gene2在样本sample1的排序位置为5,则行均值的第5行的18.6即为gene2的表达值。 当然,quantile normalization的过程无需自己动手写代码来实现,在R里面有可用的包来做这个事,如下面用preprocessCore包的函数来完成: >...
那么它到底对我们的表达数据做了什么呢? 首先要么要清楚一个概念,表达矩阵的每一列都是一个样本,每一行都是一个基因或者探针,值就是表达量咯。 quantile normalization 就是对每列单独进行排序,排好序的矩阵求平均值,得到平均值向量,然后根据原矩阵的排序情况替换对应的平均值,所以normalization之后的值只有平均值了...
分位数标准化(Quantile Normalization)后,每个样本的值都相同,但是原始的基因顺序被保留了下来。他们称之为“Quantile Normalization”,因为标准化的数据集有分位数相同。
分位数归一化这种方法常用于芯片测序数据,但这种方法也过于粗暴,结果往往不是很好;在芯片数据预处理时,可以使用R中preprocessCore包中打包好的分位数归一化函数。 # 安装 if(!requireNamespace("BiocManager",quietly=TRUE))install.packages("BiocManager")BiocManager::install("preprocessCore") ...