seqtk seq -aQ64 -q20 in.fq > out.fa 2. 得到互补序列 seqtk seq -r in.fq > out.fq # 此处的输入/输出文件也可以是fa格式 3. 根据reads ID 提取 reads seqtk subseq in.fq name.id > out.fq 4. 根据 bed 文件提取指定 reads seqtk ...
seqtk subseq **.fasta **.txt > out.fasta 还有seqkit的方法("苏牧传媒"): https://www.jianshu.com/p/471283080bd6
seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 2.sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 #可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3.subseq 提取序列 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk ...
sudo apt-getinstall seqtk 二、用法 Seqtk主要功能都在这个选项中,也是最常用的几项: 1.sample 用于抽样 2.subseq提取序列 3.fqchkfastq质量评估 4.mergepe合并pairendreads 5.trimfq很明显是截取fastq 6.hety计算某个区域杂合性,筛选杂合位点 1.gc识别高低gc区域 2.mutfa标记出高变区 3.mergefa合并fastq或...
2.得到反向互补序列seqtk seq -Ar input.fastq > output.fasta 3.seqtk comp: 得到fastq/fasta 文件的碱基组成(输出格式:序列id 序列长度 A C G T )seqtk comp in.fa > out.fa4.subseq 根据name.list(不带>符号)提取子序列 -l可设定输出的每行长度seqtk subseq -l 40 B1_NR100nl.fasta name.list ...
可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 案例3:subseq 提取序列 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseq in.fa reg.bed > out.fa 根据输入的name list,提取相应名称序列: ...
seqtk sample-s100 Sample_R1.fq.gz10000# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 代码语言:javascript 复制 # 根据输入的bed文件信息,将固定区域的序列提取出来: ...
seqtk subseq in.fa reg.bed > out.fa 09. 根据reg.bed文件中的区域将对应序列转换成小写; seqtk seq -M reg.bed in.fa > out.fa 10. 直接对FASTQ文件进行序列随机提取10000 reads,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应; ...
# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 # 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseq in.fa reg.bed > out.fa # 根据输入的name list,提取相应名称序列: ...
用此指令提取序列. 可以观察到第一个参数是源文件,第二个参数是对应键名文件,我们根据name.list去提取文件. seqtk subseq genome.fa name.list | less -N 我们可以改变name.list的文件内容,让subseq提取不同位置的碱基.代码保持不变,获得的碱基不同了. ...