fastq-dump本身不支持多线程处理。 如果你需要多线程处理SRA文件并转换为FASTQ格式,可以考虑使用fasterq-dump或parallel-fastq-dump这两个工具。 fasterq-dump:这是NCBI提供的sra-tools工具包中的一个工具,支持多线程处理。你可以通过-e参数指定线程数。例如: bash fasterq-dump -p -e 24 --split-3 -O ${outdi...
pfastq-dump介绍 一个SRA格式的转录组数据大概在3G左右,使用hisat2比对可直接使用SRA作为输入文件;但如果使用BWA比对,则必须转换成fastq格式。pfastq-dump支持多线程拆分,相比于NCBI 工具fastq-dump效率大幅提升。 1. github下载 git clone https://github.com/inutano/pfastq-dump cd pfastq-dump/ chmod a+x ...
fastq-dump(gzip模式):耗时8m35sfasterq-dump:无--gzip选项,结合多线程压缩工具pigz,耗时2m14sparallel-fastq-dump(gzip模式):耗时1m1s接着,测试2.6GB的10X测序SRA文件:fastq-dump(gzip):耗时38m23sfasterq-dump + pigz:耗时11m12sparallel-fastq-dump(gzip):耗时4m2s由此可见,parallel...
③ parallel-fastq-dump(--gzip) 用时:4m2s(处理10x数据的参数与fastq-dump一致,仅用--split-files即可) time ( parallel-fastq-dump -t 12 -O ./ --split-files --gzip -s SRR7722937.sra ) 通过以上测试,可以看到parallel-fastq-dump是处理SRA文件最为快速的!!! 在本例中,调用12线程,parallel-fastq-...
002、fasterq-dump的多线程速度测试 [b20223040323@admin1 test02]$ ls SRR3156163.sra SRR3156164.sra [b20223040323@admin1 test02]$ md5sum*9e819f5e4499b54fd657163d82d07da9 SRR3156163.sra 9e819f5e4499b54fd657163d82d07da9 SRR3156164.sra
nohup prefetch-O .$(<srr_acc_list.txt)&<=""span="">fastq-dump--gzip--split-files*.sra&gunzip*.fastq.gz 软件下载 仍然使用我们的老朋友miniconda下载,真的很方便,miniconda的安装方法小果也分享过哦~ conda create--name fastp-y conda activate fastp ...
从用户模式(user mode)来看, 两者的总CPU使用时间都差不多是560秒,从内核模式来看(Kernel Mode)来看,fasterq-dump花了更多时间在调用底层硬件上,例如分配内存地址。fastq-dump基本上稳定在一个线程,而fasterq-dump尽管指定了20个线程,但平均只用了11.5个线程吧。
多线程解压SRA文件 这个软件用起来跟fastq区别不大,主要区别在于 -e 这个指令,可以指定线程数。 这里使用 -e 16指定16线程运行。 代码语言:javascript 代码运行次数:0 fasterq-dump-e16--split-files-O~/tmpSRR1039510.sra 运行结果: spots read : 22,852,619 reads read : 45,705,238 reads written : 45...
fastq-dump--split-filesSRR6232298.sra SRR6232298.sra是一个PE测序结果,所以,需要--split-files参数可以将其分解为两个fastq文件。 如果不加该参数,则只有1个fastq文件(包含了两端测序的结果) ###二.批量拆解sra文件 ###1. 新建脚本文件nano fqdump.sh ###2. 输入以下脚本#!/bin/sh for i in *sra ...
fastp是一款用于高通量测序数据质量控制和数据预处理的快速工具。 它可以对Illumina平台的测序数据进行质量控制、过滤低质量序列、截断3'端低质量序列、去除接头序列等操作,同时还可以统计序列质量分布、GC含量分布、错误率分布、N含量等信息。 fastp采用多线程加速,速度快、准确性高,并且支持多种数据输入和输出格式。今天...