1. 先测试处理一个450MB的单端测序SRA文件所用时间 ① fastq-dump ② fasterq-dump ③ parallel-fastq-dump 2. 再测试处理一个2.6G的10X测序SRA文件所用时间 ① fastq-dump (--gzip) ② fasterq-dump + pigz ③ parallel-fastq-dump(--gzip) 最近新发现一个工具——parallel-fastq-dump,能多线程运行fastq...
1. 先测试处理一个450MB的单端测序SRA文件所用时间 ① fastq-dump (非--gzip模式) 用时:1m49s time(fastq-dump-O./--split-3SRR3414630.sra) (--gzip模式) 用时:8m35s time(fastq-dump-O./--split-3--gzipSRR3414630.sra) ② fasterq-dump fasterq-dump工具已经是包含在sra-tools中了,不需要额外再...
--split-3 : 将双端测序分为两份,存放在不同的文件,但是对于一方有而一方没有的reads会单独放在一...
首先,介绍parallel-fastq-dump的基本信息。其使用依赖于fastq-dump,需预先安装sra-tools。在测试处理450MB的单端测序SRA文件时,执行:fastq-dump(gzip模式):耗时8m35sfasterq-dump:无--gzip选项,结合多线程压缩工具pigz,耗时2m14sparallel-fastq-dump(gzip模式):耗时1m1s接着,测试2.6GB的10X...
默认情况下fastq-dump不对reads进行拆分, 对于很早之前的单端测序没有出现问题.但是对于双端测序而言,就会把原本的两条reads合并成一个,后续分析必然会出错. 常见的参数有三类: --split-spot: 将双端测序分为两份,但是都放在同一个文件中 --split-files: 将双端测序分为两份,放在不同的文件,但是对于一方有而...
默认情况下fastq-dump不对reads进行拆分, 对于很早之前的单端测序没有出现问题.但是对于双端测序而言,就会把原本的两条reads合并成一个,后续分析必然会出错. 常见的参数有三类: --split-spot: 将双端测序分为两份,但是都放在同一个文件中 --split-files: 将双端测序分为两份,放在不同的文件,但是对于一方有而...
#single-end 单端测序 .../fastq-dump DRR000003.sra # 结果生成DRR000003.fastq .../fastq-dump --fasta DRR000003.sra # 结果生成DRR000003.fastq #pair-end 双端测序 .../fastq-dump --split-3 DRR002018.sra # 结果生成 DRR002018_1.fastq,DRR002018_2.fastq ...
#single-end 单端测序 .../fastq-dump DRR000003.sra # 结果生成DRR000003.fastq .../fastq-dump --fasta DRR000003.sra # 结果生成DRR000003.fastq #pair-end 双端测序 .../fastq-dump --split-3 DRR002018.sra # 结果生成 DRR002018_1.fastq,DRR002018_2.fastq...
--split-3:不知道sra是单端还是双端,默认使用--split-3 常见的参数有三类: --split-spot: Split spots into individual reads (将双端测序分为两份,但是都放在同一个文件中) --split-files: Write reads into separate files. Read number will be suffixed to the file name.NOTE! The `--split-3` ...
检查测序数据是单端还是双端的方法:1. fastq-dump --stdout --split-spot /path/to/SRR8206319.sra...