2. 单端数据拆分 对prefetch命令下载.sra数据进行拆分。# SRA数据下载,提前安装好prefetchnohup prefetch ...
time ( fasterq-dump -e 12 -O ./ --split-files --include-technical SRR7722937.sra ; pigz -p 12 *fastq) ③ parallel-fastq-dump(--gzip) 用时:4m2s(处理10x数据的参数与fastq-dump一致,仅用--split-files即可) time ( parallel-fastq-dump -t 12 -O ./ --split-files --gzip -s SRR772293...
1. 先测试处理一个450MB的单端测序SRA文件所用时间 ① fastq-dump (非--gzip模式) 用时:1m49s time(fastq-dump-O./--split-3SRR3414630.sra) (--gzip模式) 用时:8m35s time(fastq-dump-O./--split-3--gzipSRR3414630.sra) ② fasterq-dump fasterq-dump工具已经是包含在sra-tools中了,不需要额外再...
使用pfastq_dump,因为pfastq_dump是基于fastq_dump写的一个bash程序,所以参数是相同的: 对于单端数据转换,转换后文件是fq.gz: for id in *sra; do pfastq-dump --threads 10 ./$id --gzip; done 对于双端数据转换,转换后文件是fq.gz: for id in *sra; do pfastq-dump --threads 8 ./$id --spl...
首先,介绍parallel-fastq-dump的基本信息。其使用依赖于fastq-dump,需预先安装sra-tools。在测试处理450MB的单端测序SRA文件时,执行:fastq-dump(gzip模式):耗时8m35sfasterq-dump:无--gzip选项,结合多线程压缩工具pigz,耗时2m14sparallel-fastq-dump(gzip模式):耗时1m1s接着,测试2.6GB的10X...
#single-end 单端测序 .../fastq-dump DRR000003.sra # 结果生成DRR000003.fastq .../fastq-dump --fasta DRR000003.sra # 结果生成DRR000003.fastq #pair-end 双端测序 .../fastq-dump --split-3 DRR002018.sra # 结果生成 DRR002018_1.fastq,DRR002018_2.fastq ...
数据格式 不懂也加: reads拆分 默认情况下fastq-dump不对reads进行拆分, 对于很早之前的单端测序没有出现问题.但是对于双端测序而言,就会把原本的两条reads合并成一个,后续分析必然会出错. 常见的参数有三类: --split-spot: 将双端测序分为两份,但是都放在同一个文件中 ...
#single-end 单端测序 .../fastq-dump DRR000003.sra # 结果生成DRR000003.fastq .../fastq-dump --fasta DRR000003.sra # 结果生成DRR000003.fastq #pair-end 双端测序 .../fastq-dump --split-3 DRR002018.sra # 结果生成 DRR002018_1.fastq,DRR002018_2.fastq...
检查测序数据是单端还是双端的方法:1. fastq-dump --stdout --split-spot /path/to/SRR8206319.sra...
但是最近解压双端数据出现了报错:unrecognized option: '--split-3'。 解压单端数据: fastq-dump Col.sra 解压双端数据: fastq-dump --split-3 Col.sra 代码很简单应该没错啊,找了很久的原因,最后发现是我装的默认版本fastq-dump v2.10.0有问题,再安装一个老版本fastq-dump v2.9.0就好了。 /software/...