以下是一些示例代码: fastq 转换为 fasta seqtk seq -a in.fq.gz > out.fa # 根据质量进行简单过滤,碱基质量低于q20的被小写 seqtk seq -aQ64 -q20 in.fq > out.fa 得到互补序列 seqtk seq -r in.fq > out.fq # 此处的输入/输出文件也可以是fa格式 根据reads ID 提取 reads seqtk subseq in.fq...
seqtk subseq sample.fasta regions.txt 其中,regions.txt是一个文本文件,用于指定要提取的序列区域。每一行对应于一个区域,格式为"序列名:起始位置-结束位置"。 3. sample:用于从序列文件中随机抽取指定比例的序列。例如,下面的命令将从序列文件sample.fasta中随机抽取10的序列并输出到新的文件中: shell seqtk samp...
cd seqtk; make 二、使用示例 包含的命令行: seq common transformation of FASTA/Q # FASTA/Q 的转换 comp get the nucleotide composition of FASTA/Q # 获取FASTA/Q的核苷酸组成 sample subsample sequences # 获取样本序列 subseq extract subsequences from FASTA/Q # 提取子序列 fqchk fastq QC (base/qua...
用此指令提取序列. 可以观察到第一个参数是源文件,第二个参数是对应键名文件,我们根据name.list去提取文件. seqtk subseq genome.fa name.list | less -N 我们可以改变name.list的文件内容,让subseq提取不同位置的碱基.代码保持不变,获得的碱基不同了. 这里有一个点需要科普.我们在文件...
4.subseq 提取序列 4.1根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseq in.fa reg.bed > out.fa 4.2根据输入的name list,提取相应名称序列: seqtk subseq in.fq name.lst > out.fq 5.截取序列 5.1切除reads的前5bp,以及后10bp: