seqtk seq -aQ64 -q20 in.fq > out.fa 2. 得到互补序列 seqtk seq -r in.fq > out.fq # 此处的输入/输出文件也可以是fa格式 3. 根据reads ID 提取 reads seqtk subseq in.fq name.id > out.fq 4. 根据 bed 文件提取指定 reads seqtk ...
根据ID从FASTA文件中批量提取序列是做序列分析常做的事情,有网友让我帮忙从11万条中挑选7万条,我自己写写了一个,太慢了;后来发现Biopython官方文档里面“Cookbook – Cool things to do with it”第一件事就是做这个事情的,后来我又学习了“冷月”小伙伴在知乎的帖子,稍微改写了一下,其实就是ctrl+c和ctrl+v...
seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 2.sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 #可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3.subseq 提取序列 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk ...
seqtk sample -s100 Sample_R1.fq.gz 10000 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 案例3:subseq 提取序列 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseq in.fa reg.bed > out.fa 根据输入的name list,提取相应名称序列: ...
Seqtk是一款针对fasta/fastq文件进行处理的小程序,有很多的功能,速度很快,很方便。 一、安装 sudo apt-getinstall seqtk 二、用法 Seqtk主要功能都在这个选项中,也是最常用的几项: 1.sample 用于抽样 2.subseq提取序列 3.fqchkfastq质量评估 4.mergepe合并pairendreads ...
seqtk sample-s100 Sample_R1.fq.gz10000# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 代码语言:javascript 代码运行次数:0 复制 Cloud Studio代码运行 # 根据输入的bed文件信息,将固定区域的序列提取出来: ...
2.得到反向互补序列 seqtk seq -Ar input.fastq > output.fasta 3.seqtk comp: 得到fastq/fasta 文件的碱基组成 (输出格式:序列id 序列长度 A C G T ) seqtk comp in.fa > out.fa 4.subseq 根据name.list(不带>符号)提取子序列 -l可设定输出的每行长度 ...
seqtk subseq in.fa reg.bed > out.fa 09. 根据reg.bed文件中的区域将对应序列转换成小写; seqtk seq -M reg.bed in.fa > out.fa 10. 直接对FASTQ文件进行序列随机提取10000 reads,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应; ...
用此指令提取序列. 可以观察到第一个参数是源文件,第二个参数是对应键名文件,我们根据name.list去提取文件. seqtk subseq genome.fa name.list | less -N 我们可以改变name.list的文件内容,让subseq提取不同位置的碱基.代码保持不变,获得的碱基不同了. ...
# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 # 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseq in.fa reg.bed > out.fa # 根据输入的name list,提取相应名称序列: ...