HISAT2是一款是由Daehwan Kim、Christopher Bennett和Steven Salzberg(Johns Hopkins University)等人开发的高效的基因组比对软件,专为高通量测序数据设计,用于比对大规模RNA序列数据到参考基因组。HISAT2是HISAT的升级版,引入了几个关键技术,如使用分层索引(hierarchical indexing)和全局Ferragina-Manzini (FM)索引结合多个...
HISAT2官网https://daehwankimlab.github.io/hisat2/ HISAT2 下载 https://daehwankimlab.github.io/hisat2/download/ Binaries Version: HISAT2 2.2.1 Release Date
首先,Hisat2是一款专为转录组数据设计的短序列比对工具,是其前辈Hisat的升级版。它通过优化索引构建和比对策略,相较于Bowtie/TopHat2等软件,提供了更高的敏感性和更快的处理速度。访问其详细信息可至:daehwankimlab.github.io/...安装和使用方面,Hisat2有多种途径。可以使用conda进行安装,命令...
转录组数据分析笔记(2)——使用Hisat2比对参考基因组 本片笔记主要记录Hisat2的用法,以及比较四个常用的比对参考基因组的软件。 1. 建立参考基因组索引 在进行clean data与参考基因组比对之前,我们需要先建立参考基因组索引。进入下载好参考基因组的文件目录下,运行命令: $ hisat2-build Arabidopsis_thaliana.dna....
我们提前下载好索引文件,以下是人类的索引文件网址http://daehwankimlab.github.io/hisat2/download/#h-sapiens,wget命令下载后,tar命令解压。 ###33 wgethttps://genome-idx.s3.amazonaws.com/hisat/grch38_genome.tar.gz tar -zxvfgrch38_genome.
4249:GPL15314:ASHG19A3A0042490chr6_GL000252v2_alt3219967125M85N35M*00GCCCGGCCTGGCGGAGGTGATGCTGGAGGGACGCCCGGGGAGACCGTACGTCACTGCTCTIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIAS:i:0ZS:i:0XN:i:0XM:i:0XO:i:0XG:i:0NM:i:0MD:Z:60YT:Z:UUXS:A:+NH:i:64249:GPL15314:ASHG...
--sjdbGTFfile annotations.gtf --runMode genomeGenerate 表示进行索引建立 --runThreadN 8 指定使用8...
而不是FASTA文件的列表)、--large-index(强制hisat2-build建立一个大的索引,即使参考序列的长度小于~40亿bp核苷酸长度)、-a/--noauto(禁用默认行为,即hisat2-build根据可用内存自动选择)、--bmax <int>(一个区块中允许的最大后缀数)、--bmaxdivn <int>(一个区块中允许的最大后缀数,以参考长度的分数表示...
DaehwanKimLab/hisat2 master 39Branches7Tags Code Folders and files Name Last commit message Last commit date Latest commit Cannot retrieve latest commit at this time. History 1,500 Commits docs docs_jhu evaluation example hisat2.xcodeproj
解决办法也很简单,过滤掉参考序列中长度小于 50bp 的 contig 和序列中连续 n 碱基超过 40bp 的contig 。然后重新建索引,就没有任何警告了,但是会损失部分参考序列。这样处理之后建的索引再用 HISAT2 比对 RNA-seq 数据,就没有问题了。HISAT2 比对速度确实很快,一个样本转录组数据比对 2G 的...