parallel-fastq-dump、fasterq-dump和fastq-dump是处理SRA文件的三种工具。parallel-fastq-dump作为多线程版本的fastq-dump,能显著提升处理速度。特别地,它还提供--gzip选项,直接生成压缩格式文件。下面,我们将对比这三种工具处理SRA文件的速度。首先,介绍parallel-fastq-dump的基本信息。其使用依赖于fastq-...
time(parallel-fastq-dump-t12-O./--split-files--gzip-sSRR7722937.sra) 通过以上测试,可以看到parallel-fastq-dump是处理SRA文件最为快速的!!! 在本例中,调用12线程,parallel-fastq-dump处理SRA文件比fasterq-dump+pigz快2-3倍, 比fastq-dump快8-10倍! 那之后就多尝试用parallel-fastq-dump代替我常用的faste...
fastq-dump基本上稳定在一个线程,而fasterq-dump尽管指定了20个线程,但平均只用了11.5个线程吧。 对于我们而言,我们只要看最后的total部分,也就是实际花了多少时间。fastq-dump花了快10分钟,而fasterq-dump只需要1分钟,快了9倍多。 最后还有一点不足之处:输出的fastq的ID目前暂时没有选项可以调整,需要自己写个脚本...
[b20223040323@admin1 test02]$time fasterq-dump -e48-p --split-3SRR3156163.sra -O result ## -p显示进度, -O参数指定输出目录, -e线程join :|---100%concat :|---100%spots read :51,332,776reads read :102,665,552reads written :102,665,552real 0m31.166s user 4m37.099s sys 1m7.211s...
github链接https://github.com/rvalieris/parallel-fastq-dump 需要把fastq-dump这个命令添加到环境变量 使用到的命令是 parallel-fastq-dump --threads 12 --outdir ./ --split-files -s SRR5187763.sra -T tmp/ 1. 如果sra文件已经下载好了,-s参数后指定的内容就是文件名,如果没有下载就指定SRR5187763不...
fasterq-dump ./${s} -O fastq_store -e 10 --include-technical -S echo "${s} finished at $(date)" done 这里解释一下faster-dump需要设置--include-technical才能读取barcode之类的reads,而且无法输出.gz格式的压缩文件,需要自行压缩。 运行完成后可以看到每个样本输出了3个fastq文件。
time ( parallel-fastq-dump -t 12 -O ./ --split-files --gzip -s SRR7722937.sra ) 通过以上测试,可以看到parallel-fastq-dump是处理SRA文件最为快速的!!! 在本例中,调用12线程,parallel-fastq-dump处理SRA文件比fasterq-dump+pigz快2-3倍, 比fastq-dump快8-10倍!
fasterq-dump的用法和fastq-dump一样,如下所示 fasterq-dump --split-3 ./SRR5318040 此外还有建立了GitHub Wiki提供使用教程,参见https://github.com/ncbi/sra-tools/wiki/HowTo:-fasterq-dump。 重点参数是-e|threads, 用于选择使用多少线程进行运行,默认是6个线程。 同时考虑到有些人容易着急,还提供了-p选项...
github链接https://github.com/rvalieris/parallel-fastq-dump 需要把fastq-dump这个命令添加到环境变量 使用到的命令是 parallel-fastq-dump --threads 12 --outdir ./ --split-files -s SRR5187763.sra -T tmp/ 如果sra文件已经下载好了,-s参数后指定的内容就是文件名,如果没有下载就指定SRR5187763不带后缀...