STAR在变异检测(SNP和INDEL)方面具有更好的灵敏度,因此,STAR被用于GATK最佳实践工作流程,用于从RNA-seq数据中识别短变异。 STAR的缺点是它是一种对RAM(内存)要求较高的比对工具,可能需要高端计算机进行分析,而且STAR的比对速度可能会根据可用内存而有所不同。 STAR的算法通过执行两个步骤来实现高效比对: 种子搜索(Se...
STAR安装成功后,第一步是构建index索引文件 第二步是用STAR做比对: 比对结束后,接下来是定量 定量所需软件 总结: 前言: 众所周知,RNAseq可以分为Bulk-RNAseq与scRNAseq。Bulk-RNAseq的数据量较小,单个raw fastq.gz文件<5G,普通的Mac笔记本就可以带得动,做比对和定量,完全自足;但是scRNAseq数据量较大,单个ra...
RNA-seq定量为人熟知的流程是先用STAR软件做比对生成bam,然后使用featureCounts等软件定量。不过,一直有一个疑问,为什么不直接使用STAR软件做基因表达定量呢?为此,首先问了一下ChatGPT: 可以看出ChatGPT也算是给出了比较用心的答案,虽然大部分信息说得没错,但还是有不尽人意的地方,说STAR不直接提供基...
目前最为流行的 RNA-Seq 数据比对软件是 HISAT2 和 STAR,它们可以说是大浪淘沙后的优胜者。特别值得一提的是,STAR 的升级版 STARsolo 在单细胞测序数据的比对和质控方面得到了越来越广泛的应用,感兴趣的小伙伴可以参考论文:STARsolo: accurate, fast and versatile mapping/quantification of single-cell and singl...
STAR可以将质控后的fastq.gz文件比对到参考基因组上,为后续的定量准备文件。STAR比对时,需要先用STAR构建他自己可以识别的索引文件,之后再比对 1.安装STAR conda install STAR 2.构建索引 STAR--runThreadN8\#使用的线程,可根据电脑配置自行更改--runMode genomeGenerate \#工作模式(建立索引)--genomeDir03star_ind...
我们首先考察了 Sentieon-STAR 相比 STAR 是否能够实现提速。在同样的线程数(NT=40)下,不论是 RNA-seq 数据还是靶向捕获数据,Sentieon-STAR 用时均少于 STAR(图2)。处理数据量相对少的靶向捕获数据时,Sentieon-STAR 可提速 1.0-1.5 倍,而在处理数据量大的 RNA-seq 数据时,加速模块表现更加明显,可提速 1.75-...
RNA-Seq流程由fastqc、trimmomatic、star应用构成,各应用说明如表1所示。表1 应用说明 应用名称 fastqc 对测序得到的fastq数据进行质控。 trimmomatic 使用trimmomatic工具去掉测序接头,得到去接头后fastq格式的reads。 star 使用STAR比对工具将去接头后的reads比对到参考基因组,得到bam文件和多种格式的统计报告。
因为不需要考虑外显子连接检测 (exon junction)和基因长度归一化,这一方法的数据分析也简化了(生信宝典注:其实也是需要考虑的,转录本末端或UTR区也会存在剪接,具体取决于测序读长和特定基因的结构。不过如果使用STAR/BWA等有soft-clip机制的比对工具也可以不考虑。)。但是,3ʹ mRNA-seq方法可能会受到转录本序列...
高通量测序:利用Illumina、Ion Torrent、PacBio、Nanopore等高通量测序平台,对cDNA文库进行单链或双链测序。生成大量短读长(short reads)或长读长(long reads)序列数据。数据分析:进行数据质量控制(QC),如去除低质量reads和接头序列。将高质量reads比对到参考基因组或转录组上(常用工具有Hisat2、STAR等)。
因为不需要考虑外显子连接检测 (exon junction)和基因长度归一化,这一方法的数据分析也简化了( 生信宝典注: 其实也是需要考虑的,转录本末端或UTR区也会存在剪接,具体取决于测序读长和特定基因的结构。 不过如果使用STAR/BWA等有soft-clip机制的比对工具也可以不考虑。 )。但是,3ʹ mRNA-seq方法可能会受到 转录...