流行的RNA-seq分析,如样本聚类或分类,以及差异基因表达,需要将样本之间的标准化作为确保测量结果在样本之间可比性的第一步。大多数现有的标准化方法都是为批量开发的RNA-seq实验计算全局尺度因子来调整每个样本的测序深度(每个样本一个尺度因子适用于样...
这些方法在批量 RNA-seq 中表现出优异的性能,但由于大量的零表达值,它们在单细胞设置中受到损害。此外,这些方法假设样本中所有细胞的潜在 RNA 含量是恒定的,并且可以对所有基因应用单个比例因子。因此,基于全局缩放因子的归一化策略对于典型的零膨胀和高度异质的 scRNA 数据集表现不佳。 基于基因组的方法 为了解决全局...
1.在差异分析的背景下,RNA-seq数据的标准化是必不可少的。 2.总计数和RPKM两种标准化方法仍然被广泛使用,但明确是无效的,应该在差异分析的背景下被明确放弃。 3.只有DESeq和TMM标准化方法对不同的文库大小和不同的文库组成的标准化结果是可靠的,都是真正的RNA-seq数据标准化的典型。 参考文献 Dillies M A,...
FastProject解决了二维图中单细胞RNA测序数据可视化相关的三个问题:1. 选择一种合适的数据投影方式;2. 创建投影方式后,如何理解投影数据的生物学意义,例如观察到的细胞形态与哪种表型相对应;3. 混杂因素的控制,例如基因捕获率的差异,它可以导致单细胞RNA数据难以解读。 Yosef说,“FastProject软件解决了长久以来都没有...
在RNA-Seq的分析中,对基因或转录本的read counts数目进行标准化(normalization)非常重要,因为落在一个基因区域內的read counts数目取决于基因长度和测序深度。一个基因越长,测序深度会越高,落在其內部的read counts数目就会相对越多。因此,我们使用相对测量,而不是绝对测量。
单细胞RNA测序(scRNA-seq)的目的通常是亚群鉴定和差异基因表达分析。 为避免“维度灾难”(curse of dimensionality),将高可变基因 (HVG) 用于聚类分析。 多项研究表明,HVG对原始计数矩阵标准化方法的选择很敏感。 原始read计数不能直接用于比较细胞之间的基因表达,因为它们会被实验技术和“无趣”的生物变异所混淆(干扰...
FastProject解决了二维图中单细胞RNA测序数据可视化相关的三个问题:1. 选择一种合适的数据投影方式;2. 创建投影方式后,如何理解投影数据的生物学意义,例如观察到的细胞形态与哪种表型相对应;3. 混杂因素的控制,例如基因捕获率的差异,它可以导致单细胞RNA数据难以解读。