kallisto/BUStools和Alevin/Alevin-fry都实现了各自的细胞barcode和UMI纠错和分离算法——例如,Alevin不需要(但可以使用)细胞barcode白名单。然而,与基于比对的方法最大的区别在于伪比对的准确性较低,并且包含多比对read。 kallisto/BUStools支持许多测序技术,包括CEL-seq、CEL-seq2和SMART-seq等低通量技术。可以使用kb -...
scRNAseq全序列突变分析: 突变分析大致分4步,分别是 按照10x常规分析做定量,获取matrix/barcode/feature三个文件。 按照seurat常规分析做cluster/细胞注释,确定cluster数量,获得RDS文件。 做SNV calling,获取scRNAseq数据的cover 和 mut数据文件。 针对cover和mut数据文件做可视化。 本文(三)涉及步骤4,也就是激动人心的...
kallisto/BUStools和Alevin/Alevin-fry都实现了各自的细胞barcode和UMI纠错和分离算法——例如,Alevin不需要(但可以使用)细胞barcode白名单。然而,与基于比对的方法最大的区别在于伪比对的准确性较低,并且包含多比对read。 kallisto/BUStools支持许多测序技术,包括CEL-seq、CEL-seq2和SMART-seq等低通量技术。可以使用kb -...
FastQ是您将遇到的最原始形式的scRNASeq数据。所有scRNASeq方案都使用配对末端测序进行测序。Barcode序列可以在一个或两个reads中发生,这取决于所采用的protocol 。然而,使用独特分子标识符(UMI)的protocol 通常包含一个带有细胞和UMI barcode 和 adapters 但没有任何转录序列的read。因此,尽管实际上是成对末端测序,但re...
2️⃣ 典型的scRNA-seq的workflow包括以下几个步骤:👇 将cDNAmapping到reference上; 计算基因reads; 计算细胞reads(用到cell barcode); 计算的RNA数量(UMI去重)。 5具体步骤 5.1 Read Mapping 处理10x Genomics Chromium scRNAseq数据,我们通常要用到Cell Ranger,具体原理我们在这里就不做具体介绍了,大家有兴趣...
为了解决这个问题,细胞barcode被随机核苷酸序列唯一地标记,即UMI,因此该序列对于单个分子是唯一的。 该UMI是测序读长的一部分,然后在量化转录本的丰度时可以进行计算考虑。 目前大多数scRNA-seq方案都是基于标签的,包括流行的基于液滴的10x Chromium方案,如下图所示。 基于标签的协议的一个缺点是,仅限于转录本的一端...
但与CEL-seq不同的是,MARS-seq在单细胞分离时,主要使用的是FACS流式分选,而CEL-seq2/C1单细胞采用细胞稀释法。 MARS-seq2.0是在MARS-seq基础上,整合index 分选以及大量平行单细胞RNA测序方法,从而形成的一套流程。MARS-seq2.0引物包含T7启动子、6bp的barcode 以及8bp的UMI,待单细胞被FACS分选后,进一步将单细...
细胞计数:利用输入数据的barcode将每个细胞的reads区分出来 UMI计数:只有比对到转录组可信度高的reads才能用于UMI计数 例如得到的fastq文件如下: sample_S1_L001_R1_001.fastq.gz sample_S1_L001_R2_001.fastq.gz #一般来讲R1比R2小是正常的,因为我们要的read1只有二十几bp ...
处理原始scRNA-seq数据 3.3 文件格式 3.3.1 FastQC FastQ是您将遇到的最原始形式的scRNASeq数据。所有scRNASeq方案都使用配对末端测序进行测序。Barcode序列可以在一个或两个reads中发生,这取决于所采用的protocol 。然而,使用独特分子标识符(UMI)的protocol 通常包含一个带有细胞和UMI barcode 和 adapters 但没有任何...
由4个组成部分,第一段叫做read1, 其实就是adapter序列,用于后续的上机测序,第二段是barcode, 长度为16bp, 用于区分不同的细胞,第三段是UMI, 用于区分不用的转录本序列,长度为12bp, 第四段在不同的试剂盒中对应不同的序列,但是作用是相同的,都是用于捕获目的序列,对于转录组测序而言,就是一个30bp的ployT结...