之前转录组数据分布规律的失败探索中的例子(GSE164425,统计Raw Count与CPM数据分布)可见bulk RNA-seq的原始定量数据并不符合正态分布。 因此直接使用t检验并不可取。目前大多数差异分析用的是limma、edgeR、DESeq2这三个包。 limma、edgeR、DESeq2包都建议使用Counts作为输入,也就是原始计数矩阵作为输入进行分析,最好...
当我们说“不同”时,实际上是指哪些基因在表达上的差异大于随机统计波动所预期的差异。这种变化的大小通常表示为条件之间标准化表达值的对数倍变化,并且统计波动采用负二项式分布进行参数化。用于处理 bulk RNA-seq(例如 edgeR 或 DESeq2 )的工具非常强大且成熟。 因此,当单细胞 RNA-seq 出现时,能将相同的想法应...
仔细观察DESeq2的结果可以发现很多基因的结果包含NA,最终获得的可用数据(删除存在缺失值的行)比初始输入少了很多: res <- results(dds, contrast = c("group_list","Tumor","Normal"))# 默认pAdjustMethod = "BH" resOrdered <- res[order(res$padj),] head(resOrdered) DEG <- as.data.frame(resOrde...
【1】Bulk RNA-seq和scRNA-seq数据收集与预处理 文献解读 TCGA、GEO公共数据下载 差异表达基因分析 富集分析 【翰佰尔生物】, 视频播放量 2280、弹幕量 0、点赞数 91、投硬币枚数 47、收藏人数 353、转发人数 30, 视频作者 翰佰尔生物, 作者简介 官网:henbio.com/tools |
RNA-seq:用于测定细胞或组织中RNA的相对丰度,从而了解基因表达水平。 5. 优缺点: 优点:成本相对较低,数据处理相对简单,适用于已知细胞群体的研究。 缺点:无法提供单个细胞水平的信息,无法解析细胞异质性。 如何选择: 研究目的:根据研究问题和目的选择合适的测序方法,如果需要了解单个细胞之间的差异,选择单细胞测序;如...
1.Bulk RNA-seq是入门生物信息学的好途径,是学习后续进阶内容(如单细胞RNA-seq和空间RNA-seq)的基础,如果没有接触过Bulk RNA-seq,一开始就去学习单细胞RNA-seq,学习难度和成本会大大增加; 2.Bulk RNA-seq在过去、现在和未来的应用场景:十几年前Bulk RNA-seq刚出现的时候,简单测序和分析就可以发表一篇令人满意...
Bulk RNA-seq研究能保证测序深度,实现转录本的均匀覆盖,但特异性不足;scRNA-seq研究能精细到细胞水平,去除污染,保证基因检出的高特异性,但低丰度细胞类型,转录本检出的敏感性又差。很多研究开始两种技术结合使用,追赶热点的同时,实现优势互补,提升基因表达检测的全面性和准确性。
一般来说 RNA-Seq 重复率会比较高。ATCG 碱基占比容易出现前面碱基不稳定。多查看几个样本表现,如果波动模式差不多说明是随机引物不随机导致的,可以选择移除或不移除。 ATCG 占比前面碱基有波动 hisat2 比对 比对推荐 hisat2 不推荐 bowtie2. 因为 bowtie2 对剪切不友好,即使提高--maxins参数允许更长的片段...
四、以DESeq2为例演示全过程 篇幅有限,本文仅演示基于DESeq2的差异分析全过程(基于counts进行分析,不能用tpm、fpkm等归一化后的数据,想获得练习数据,可在公众号输入:Bulk RNA-seq练习数据2)。 1.安装并加载R包(若有,则不用重新安装) install.packages('R.utils') ...