分析scRNA-seq数据时,绘制标记基因的特征图通常是一个良好的起点。然而,要深入理解数据中的异质性,需要通过无偏的方式将细胞分组,这就是聚类的作用。理论上,任何聚类方法都可以应用于 scRNA-seq 数据,包括层次聚类和 k-means 等常用于 bulk RNA-seq 数据的方法。但由于 scRNA-seq 数据样本量通常极大(如一次 10x ...
第一种方法的目标是将两个数据集中的细胞簇或细胞类型进行关联。这种方法虽然简单,但存在一个明显的缺陷:两个数据集中的细胞簇或细胞类型可能没有以相同的分辨率定义,因此难以直接比较。这一问题在动态系统中尤为突出,例如发育或再生过程,这些系统中细胞状态是连续变化的,而聚类分析可能会因数据集的不同而以不同的...
什么是单细胞 RNA 测序(scRNA-Seq)数据? 单细胞 RNA 测序(single-cell RNA seq,scRNA-Seq)是一种用于分析单个细胞中基因表达水平的技术。即可以在单个细胞的水平上检测 RNA 表达。传统的 RNA 测序( Bulk RNA-Seq)方法只能测量样本整体的表达水平,而不能反映细胞间的异质性。
RNA速度是基因表达状态的时间衍生物,可以通过在常见的scRNAseq协议中区分未剪接和剪接的mRNA来直接估计。RNA速度是一种高维向量,以小时为时间尺度预测单个细胞的未来状态。TradeSeq基于称为Slingshot的先前方法,在简单轨迹分析方面优于其他方法。另一个有用的软件包是PHATE,它是一种可视化方法,使用数据点之间的信息几何距...
单细胞RNA测序(scRNA-seq)技术允许在单细胞分辨率下解析基因表达,这极大地改变了转录组学研究。目前已经开发了大量的scRNA-seq protocol,这些protocol各有特点,各有优缺点。由于技术限制和生物因素,scRNA-seq数据比 bulk RNA-seq数据更嘈杂、更复杂。scRNA-seq数据的高度可变性给数据分析带来了计算方面的挑战。虽然越来...
Fig 1.肾脏scRNA-seq数据创建和分析流程。数据矩阵生成和质量控制 单细胞分析的关键是barcode,在逆转录过程中,barcode被添加到RNA分子中,从而可以识别单个细胞。第一个分析步骤是生成数据矩阵,数据矩阵表示来自原始测序文件的转录本数据库的barcode(细胞)。对于10×基因组学数据,CellRanger (table1,总结了文中...
单细胞RNA-seq数据分析最佳实践(上) Pre-processing and visualization Normalization 计数矩阵中的每个计数代表细胞 mRNA 分子的成功捕获、逆转录和测序(框 1)。由于每个步骤固有的变异性,相同细胞的计数深度结果却可能不同。因此,当基于计数数据比较细胞间的基因表达时,任何差异可能仅由采样效应( sampling effects.)引...
流行的RNA-seq分析,如样本聚类或分类,以及差异基因表达,需要将样本之间的标准化作为确保测量结果在样本之间可比性的第一步。大多数现有的标准化方法都是为批量开发的RNA-seq实验计算全局尺度因子来调整每个样本的测序深度(每个样本一个尺度因子适用于样...
单细胞RNA-seq数据分析中最常用的标准化方法与TPM(每百万读数的转录本数)概念类似 - 即对每个细胞的特征表达量进行标准化,然后乘以一个缩放因子(默认为10000)。最后,将得到的表情水平进行对数转换,以便表达值更符合正态分布。值得一提的是,在进行对数转换之前,每个值都会加上一个伪计数,这样即使在某个细胞中未...
10. 数据整合 10.1 总论 大多数scRNA-seq数据分析的一个核心挑战是批次效应。批次效应是测量的表达水平的变化,这是处理不同组或“批次”中的细胞的结果。例如,如果两个实验室从同一队列中采集样本,但这些样本的解离方式不同,则可能会出现批次效应。如果实验室A优化其解离方案以解离样品中的细胞,同时最大限度地减少...