1.数据预处理, 使样本间具有可比性 2. boxplot查看样本的基因整体表达情况 3. 查看不同分组的聚类情况:样本hclust 图、距离热图、PCA图、差异基因热图、相关性热图 承接上节RNA-seq入门实战(三):从featureCounts与Salmon输出文件获取counts矩阵在进行差异分析前需要进行数据检查,保证我们的下游分析是有意义的。 以下...
dds.plot_volcano(title='DEG Analysis',figsize=(4,4),plot_genes_num=8,plot_genes_fontsize=12,) 差异表达火山图 如果我们想绘制特定的基因的箱线图,我们也可以使用plot_boxplot函数来完成该任务。 dds.plot_boxplot(genes=['Ckap2','Lef1'],treatment_groups=treatment_groups,control_groups=control_gro...
boxplot(logcounts, xlab="", 多维缩放分类 现在,我们可以进行一些统计建模了。 多维缩放是主成分分析的一个类似物。它提供了一种简单的方法,可以查看样本组是否沿着其第一和第二维度分开。这是基于主要差异倍数度量的。 这检查了在样本之间表现出最大倍数差异的基因子集。 下面的图显示了12个样本的分离和聚类,但...
现在看起来平淡无奇,如果样本多,可以画出点图配boxplot,如果是配对样本,那么还可以画出配对的图。 有一点要强调一下,vst,以及log2的标准化,跟标准化的counts不是一个概念。前者是为了以后的聚类,热土,PCA分析,比如,我们计算样本间的距离就是用的vst 标化的数据,而标准化的counts是为了差异作图,你看纵坐标就会...
boxplot(logcounts, xlab="", 1. 2. 3. 多维缩放分类 现在,我们可以进行一些统计建模了。 多维缩放是主成分分析的一个类似物。它提供了一种简单的方法,可以查看样本组是否沿着其第一和第二维度分开。这是基于主要差异倍数度量的。 这检查了在样本之间表现出最大倍数差异的基因子集。
boxplot(normCunt,ylim=c(-1,2000)) 5.差异表达计算,并写入文件 normDiff<-DESeq(normTab)resDiff<-results(normDiff)head(resDiff)write.table(resDiff,"AP53_DESeq2_withNorm.txt",row.names=TRUE,quote=FALSE,sep="\t") 6.作图查看结果: p-value分布图, MA图, 火山图 ...
# 使用箱线图检查样本的分布boxplot(logcounts,xlab="", 多维缩放分类 现在,我们可以进行一些统计建模了。 多维缩放是主成分分析的一个类似物。它提供了一种简单的方法,可以查看样本组是否沿着其第一和第二维度分开。这是基于主要差异倍数度量的。 这检查了在样本之间表现出最大倍数差异的基因子集。
# 使用箱线图检查样本的分布boxplot(logcounts, xlab="", 多维缩放分类 现在,我们可以进行一些统计建模了。 多维缩放是主成分分析的一个类似物。它提供了一种简单的方法,可以查看样本组是否沿着其第一和第二维度分开。这是基于主要差异倍数度量的。 这检查了在样本之间表现出最大倍数差异的基因子集。
boxplot(ex1,las=2,cex.axis=0.6,main='datacheck') 二,提取数据 ##提取数据。因为之前讲过,我们只看肿瘤周围的肝细胞跟正常肝周细胞对比。所以在此我们提取我们的目的数据。## PHex<-ex[,1:6] PHex[1:4,1:6]##查看一下数据。(rawcounts数据) ...
>boxplot(fpkm,col=as.numeric(pheno_data$sex),las=2,ylab='log2(FPKM+1)') 图1 8.2就单个转录本的查看在样品中的分布 > ballgown::tranNames(bg)[12] 12 "NR_027232" > ballgown::geneNames(bg)[12] 12 "LINC00685" #绘制箱线图