过去的 10 多年,已经开发了多种比对工具来应对快速增长的 RNA-Seq 测序数据,本文就来盘点一下其中几个比较经典的工具。 2009 TopHat TopHat 是一款经典的 RNA-Seq 数据比对软件,能够精确地将测序 reads 比对到基因组上。其利用 Bowtie 进行快速比对,并考虑了剪接事件,提高了对剪接变异的检测灵敏度。曾经Tophat ...
STAR(Spliced Transcripts Alignment to a Reference)是用于将RNA-seq读取数据与参考基因组序列进行高度准确和超快速的剪接感知(_splice aware)_比对的工具。注意,STAR是一个专门针对RNA-seq数据映射的比对工具,这意味着不能用于比对DNA数据。 与其他流行的剪接感知RNA-seq比对工具(如HISAT2和TopHat2)相比,STAR具有更...
目前最为流行的 RNA-Seq 数据比对软件是 HISAT2 和 STAR,它们可以说是大浪淘沙后的优胜者。特别值得一提的是,STAR 的升级版 STARsolo 在单细胞测序数据的比对和质控方面得到了越来越广泛的应用,感兴趣的小伙伴可以参考论文:STARsolo: accurate, fast and versatile mapping/quantification of single-cell and singl...
如上图所示,mRNA reads 比对到基因组时可能遇到三种情况:一是read完全比对到1个exon内(红色),二是read跨越2个exon(蓝色),三是read跨越2个以上的exon(紫色)。在过去十多年里,为了应对日益增长的RNA-Seq测序数据,已涌现出多种比对工具。本文将概述其中几款经典工具。首先是2009年推出的TopHat,这款软件...
序列比对 又称为align RNA-Seq 分析中的策略从文件类型来看如下: FASTQ文件 SAM文件 BAM文件 FASTQ文件到SAM文件这一步就需要比对软件 [STAR、Tophat2、HISAT2] 来实现,目的是 把RNA-seqreads比对到合适的参考序列上. 如果用基因组作为参考序列可以检测到新的转录本,但可能需要耗费更多的计算资源;如果用转录组作...
一、序列比对软件区别 在对比对工具进行比较时,通常将其分为DNA比对工具(DNA-seq)和RNA比对工具(RNA-seq)。 它们的区别在于是否会考虑跨外显子的比对,即:是否会将没有比对上的reads劈开,对劈开后的两部分再次比对。(PRO-seq/GRO-seq,它们虽然在建库时捕获的RNA,但是它们的比对并不需要考虑跨外显子) ...
STAR是用于准确、快速比对RNA-seq读取数据至参考基因组的工具,专门针对RNA-seq数据,不适用于DNA数据。STAR与HISAT2、TopHat2等工具相比,具有更高映射率、更快速度,且在经典和非经典剪接位点识别、嵌合转录本检测方面表现优异。STAR能准确映射短、长读取数据。在变异检测方面,STAR具有更好灵敏度,广泛...
HISAT 是 Tophat 作者团队在 2015 年推出的一款 RNA-Seq 比对工具。它基于 Hierarchical Graph FM Index,能迅速、准确地处理大规模测序数据,具备较低的内存占用和高效的多线程处理能力。HISAT 在 2016 年与 StringTie 和 Ballown 组合成为转录组最佳实践流程,Galaxy 网站集成了这一经典流程。HISAT 的...
STAR的主程序只有两个:STAR和STARlong。前者用于比对RNA-seq数据,后者是针对于长读长RNA数据。由于同一个程序,又需要做建索引,又需要做序列比对,并且这个程序还支持一系列的输出格式,因此直接用STAR,你会迷失在参数的海洋中。所以我们需要先阅读文档,先对整体有一个了了解。