本期,小编继续“看图说话”,一起看看RNA-seq基础分析里的图示都反映了哪些内容吧。 1 主成分分析图(PCA图)---用RNA测序结果体现样本聚类 主成分分析图是生信分析中最朴实无华的,因为谁都能看的懂。我们不需要操心X,Y轴的主成分到底是什么,只要明白每个样本都被一个2维坐标(X,Y)定位到了这张图上。对于基...
rv <- genefilter::rowVars(data)select <- order(rv, decreasing = TRUE)[seq_len(1000)]pca_data <- cbind(t(log10(data[select,]+1)),group) 5.进行主成分分析 expr_pca <- prcomp(pca_data[,1:1000],scale = T,center = T) 6.可视化——碎石图 fviz_screeplot(expr_pca, addlabels = TR...
3. plotPCA {DESeq2} 当我们使用的数据是表达量的时候,我们可以首选利用 DESeq2 软件包中的内置函数plotPCA 来绘制主成分分析图,非常方便,当然我们这里使用差异表达挑选出来的差异表达基因,在做主成分分析时能够更好的区分癌和癌旁组织。 首先需要构造 dds 对象, 如下: ###plotPCA {DESeq2} library(DESeq2...
主成分分析并作图。代码如下 tpm<-read.csv("E:/造血干/钟/mRNA_tpm.csv")#使用prcomp函数进行PCA分析# 数据转置,转换成行为样本,列为基因的矩阵tpm<-t(tpm)data.pca<-prcomp(tpm)# 查看PCA的分析结果summary(data.pca)# 绘制主成分的碎石图screeplot(data.pca,npcs=10,type="lines")#查看主成分的结果...
1各样本表达的情况。 用箱线图看一下,不同样品之间的表达量的均值要相对一致。若不一致,后序要用经过标准化至均值一致才能比较。我们用TCGA上下载的肝癌和胆管癌的count数据来举个例子,可以看到count在标准化前中位数值不一。 Raw count矩阵分布 而经过deseq2七步矫正标准化过后,中位数值明显统一了。
从图中我们很容易发现,基于负二项分布的差异分析检验(P value),FPR 对生物学重复数和单个样本数据量均不敏感,始终保持低于 0.1%水平。或者说,这个算法对 FPR 的控制还是非常理想的。 讨论 随着测序单价的下降,目前市场上 RNA-seq 类项目的单样本测序量正在不断提高。以 2G,PE100 测序的表达谱项目为例,其对应...
整个RNA-seq数据的可重复性检测来排除批次效应(技术重复系数Spearman R2 > 0.9)。若相同条件下基因表达量有差异则主成分分析(principle component analysis,PCA)应聚在一支。 图2.png 2. 转录本 有参分析时将序列比对到参考基因组或是转录组上获得表达转录本。比对到转录组上会屏蔽新的未注释的转录本,只对已知转...
PCA主成分分析 火山图分析 火山图可直观的表现两组样品的差异基因/蛋白/代谢物的分布情况。横坐标用log2...
此外,scRNA-seq技术可分为全长和3'富集方法。全长方案的数据可能会受益于考虑了基因长度的标准化方法,而3'富集测序数据则不然。TPM归一化是全长scRNA-seq数据常用的归一化方法,它来自bulk RNA-seq分析。 标准化是对细胞计数数据进行缩放处理以使其在细胞之间可比,也可以在基因层面对基因计数进行归一化 (scale)...