将fastq转换成fasta: seqtk seq -a Sample_R1.fq.gz > Sample_R1.fa 得到反向互补序列: seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 2.sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 #可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取...
将fastq转换成fasta: seqtk seq -a Sample_R1.fq.gz > Sample_R1.fa 将fastq序列做反向互补分析: seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 案例2:sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致...
将fastq转换成fasta: seqtk seq-a Sample_R1.fq.gz>Sample_R1.fa 将fastq序列做反向互补分析: seqtk seq-r Sample_R1.fq.gz>Sample_Revc_R1.fq 2. sample 随机抽样 代码语言:javascript 复制 seqtk sample-s100 Sample_R1.fq.gz10000# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需...
$seqtk sample Usage:seqtk sample[-2][-s seed=11]<in.fa><frac>|<number>#随机抽取序列,用法是seqtk sample fq/fa numOptions:-s INT RNG seed[11]#设置随机种子,默认11-22-passmode:twiceasslow butwithmuch reduced memory#占用更大的内存 ...
seqtk sample -s100 read2.fq 10000>sub2.fq 参数说明: sample: 使用的 seqtk 对应的 sample 命令, 进行reads随机提取; -s100: 设定随机数种子为100,类型为整数 (随机数种子要相同,确保 fastq 的ID对应) read1.fq/ read1.fq: 输入的 R1_fastq /...
2.2 Sample 当我们序列条数过多,全部用于实验会让代码速度减慢,所以有时我们会将序列抽样 从上图理解,格式是seqtk sample in.fa 分数|具体数字,也就是说我们可以抽取多少含量,也可以抽具体数字. seqtk sample atha.fasta 2 如果我们不改变随机种子,那么每次随机都会是一样的结果. ...
或者直接抽取固定的read 条数, 如抽取1百万条reads: 1seqtk sample -s 11 $dir/read1.fq.gz1000000|gzip >sub_r1.fq.gz2seqtk sample -s 11 $dir/read2.fq.gz1000000 |gzip> sub_r2.fq.gz 这个工具还可以根据比对的bam文件抽取子集,用法类似。
2. sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 # 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 # 根据输入的bed文件信息,将固定区域的序列提取出来: ...
一、安装 sudo apt-getinstall seqtk 二、用法 Seqtk主要功能都在这个选项中,也是最常用的几项: 1.sample 用于抽样 2.subseq提取序列 3.fqchkfastq质量评估 4.mergepe合并pairendreads 5.trimfq很明显是截取fastq 6.hety计算某个区域杂合性,筛选杂合位点 ...
seqtk sample -s100 read2.fq 0.85 > sub2.fq 如果FASTQ为压缩文件,也可以直接提取,并且在随机提取之后使用gzip重新生成压缩文件; seqtk sample -s100 read1.fq.gz 10000 |gzip > sub1.fq.gz seqtk sample -s100 read2.fq.gz 10000 |gzip > sub2.fq.gz ...