分析展示你的RNA-seq数据,从这里开始(文末附代码) 我是五百君,今天给大家分享一些入门RNA-seq的心得。 公司用illumina测序对建好库的RNA样品进行测序后,会得到一堆后缀为fastq.gz的Rawdata。然后在经过公司或者实验室人员将Rawdata进行比对后,得到了表达矩阵的数据。那么怎么对这几万个基因进行分析呢?有什么策略可以...
1. 汇总 为了汇总结果,DESeq2中一个方便的函数是summary()。它与用于检查数据帧的函数同名。当使用DESeq结果表作为输入调用此函数时,将使用默认阈值padj < 0.1汇总结果。但是,由于我们在创建结果表阈值时将alpha参数设置为 0.05:FDR < 0.05(即使输出显示 p 值 < 0.05,也使用 padj/FDR)。让我们从 OE 与对照...
1.3 结果文件解读 1.4 格式转换并排序 (二)StringTie 转录本组装 2.1 输入文件 2.2 命令行格式及命令选项 2.3 结果文件解读 2.4 合并得到非冗余转录本(可选) (三)准备差异表达分析文件 (四)DESeq2 分析差异表达基因 RNA- seq 的数据处理主要分为以下几个过程: 1. 测序数据质控,以及参考基因组和注释文件下载;...
在RNA-seq项目中,常见的结果图片包括:火山图、韦恩图、聚类热图、log2(ratios)折线图、有向无环图、散点图、代谢通路图、蛋白互作网络图等等。 本期,我们先来看看火山图、韦恩图、聚类热图和折线图。 火山图 RNA-seq中,火山图(Volcano Plot)显示了两个重要的指...
在TPM结果中:在每个样本的reads总数相同的情况下(总体相同),更能清楚的知道,rep1中匹配到基因A的reads数比例(3.33)多于rep3中匹配到基因A的reads数比例(3.326)。 在RPKM结果中:在每个样本的reads总数不相同的情况下(总体不相同),不能直接比较不同样本间每个基...
我们可以简单的把这张图理解为2个样本的RNAseq结果关联度散点图。X,Y轴分别是两个样本,每个点代表一个基因在两个样品中FPKM的对数值(FPKM是RNAseq中衡量基因表达高低的常用数值)。从这张图可以观察,偏离对角线的点越多,说明样品表达量的相关性越低,重复性越差;偏离对角线的点越少,则说明样品间表达量的相关性...
融合基因是指原来在基因组上分开的2个基因,因为某种原因,染色体发生了重排。重排的结果是让A基因的头,接到了B基因的身体上,这样就产生了融合基因。 上图为一个癌细胞中的融合基因的示意图。 上图是高通量测序测到融合基因的图。可以看到这10几个Reads都横跨在这个融合基因的交接点的两侧,由此证明了这个癌细胞当...
Confounding是指:无法区分结果是由什么原因导致的。例如,我们知道性别对基因表达有很大影响,如果我们所有...
我们可以简单的把这张图理解为2个样本的RNAseq结果关联度散点图。X,Y轴分别是两个样本,每个点代表一个基因在两个样品中FPKM的对数值(FPKM是RNAseq中衡量基因表达高低的常用数值)。从这张图可以观察,偏离对角线的点越多,说明样品表达量的相关性越低,重复性越差;偏离对角线的点越少,则说明样品间表达量的相关性...
我们可以简单的把这张图理解为2个样本的RNAseq结果关联度散点图。X,Y轴分别是两个样本,每个点代表一个基因在两个样品中FPKM的对数值(FPKM是RNAseq中衡量基因表达高低的常用数值)。从这张图可以观察,偏离对角线的点越多,说明样品表达量的相关性越低,重复性越差;偏离对角线的点越少,则说明样品间表达量的相关性...