parallel-fastq-dump直接调用fastq-dump命令,所以使用起来差不多。 示例: parallel-fastq-dump --sra-id SRR2244401 --threads 4 --outdir out/ --split-files --gzip --threads 4设置线程为4 实测parallel-fastq-dump是最快的。 4 10X测序使用的参数 fastq-dump --split-files fasterq-dump --split-files...
② fasterq-dump + pigz 用时:11m12s(注意fasterq-dump处理10x数据的参数是--split-files --include-technical,仅加--split-files得不到三个文件 ) time ( fasterq-dump -e 12 -O ./ --split-files --include-technical SRR7722937.sra ; pigz -p 12 *fastq) ③ parallel-fastq-dump(--gzip) 用时:...
--stout #直接把结果输出到屏幕上 别忘了加最后一个参数,就是数据名称 SRRxxxxxxxxxx 经典的代码是 fastq-dump --outdir file_name --gzip --skip-technical --readids --read-filter pass --dumpbase --split-files --clip SRR_ID 参考自https://edwards.sdsu.edu/research/fastq-dump...
重点参数是-e|threads, 用于选择使用多少线程进行运行,默认是6个线程。 同时考虑到有些人容易着急,还提供了-p选项用于显示当前进度。 我用一个9G大小的SRA文件,分别以fastq-dump和fasterq-dump进行了测试。 time fastq-dump --split-3 -O test SRR5318040.sra # 558.76s user 41.36s system 101% cpu 9:51.8...
[b20223040323@admin1 test02]$time fasterq-dump -e48-p --split-3SRR3156163.sra -O result ## -p显示进度, -O参数指定输出目录, -e线程join :|---100%concat :|---100%spots read :51,332,776reads read :102,665,552reads written :102,665,552real 0m31.166s user 4m37.099s sys 1m7.211s...
fastq-dump --defline-seq '@sn[_rn]/$ri' --split-3 file.sra -o ../02.fastq 习惯默认输出到上一层目录中的02.fastq这个文件夹中。想要输出到别的位置记得修改-O|--outdir参数哟 选加参数: --gzip, --bzip2: 以压缩文件的方式输出结果 ...
fastq-dump -h --split-3 也就是说如果SRA文件中只有一个文件,那么这个参数就会被忽略。如果原文件中有两个文件,那么它就会把成对的文件按*_1.fastq,*_2.fastq这样分开。如果还出现了第三个文件,就意味着这个文件本身是未成配对的部分。可能是当初提交的时候因为事先过滤过了一下,所以有一部分数据被删除了...
先看一下常规的fastq-dump SRA转fastq,由于fastq-dump是单线程的,转的过程非常非常慢,我从下午五点到晚上九点4个小时了,还在运行当中: ## 新建文件夹 mkdir 2.fastq_raw && cd 2.fastq_raw ## 做一个软连接文件 ln -s ../1.sra/SRR* ../2.raw_fastq/ ...
可以先用fastq-dump -h看一下帮助文件,分为如下几个部分: 输入: -A|—accession 序列号 处理中: Read Splitting, Full Spot Filters, Common Filters, Filters based on alignments, Filters for individual reads。 基本都是些过滤参数。不太常用 输出: -O|—outdir 输出文件夹, -Z|—stdout 输出到标准输出...