seqtk subseq **.fasta **.txt > out.fasta 还有seqkit的方法("苏牧传媒"): https://www.jianshu.com/p/471283080bd6
把要提取的 序列 ID 写入 id.txt , 一行一个ID 1.seqkit seqkit grep -f id.txt input.fa > output.fa 2.seqtk seqtk subseq input.fa id.txt > output.fa ©著作权归作者所有,转载或内容合作请联系作者 组学分析 更多精彩内容,就在简书APP ...
#多次使用 $ zcat hairpin.fa.gz | seqkit grep -r -p ^hsa -p ^mmu -v #根据ID提取序列 $ seqkit grep -f id.txt seqs.fq.gz -o result.fq.gz # ignore case $ seqkit grep -i -f id.txt seqs.fq.gz -o result.fq.gz
可用命令sed来提取关键字下一行,命令如下:sed -n '/EVM0068010/{n;p}' upstream_2kb.fasta /关键...
从fasta/fastq文件中提取子集 seqtk subseq head40.fq a.list 提取fq时需要其文件开头用>: sed -i 's/@/>@/g' head40.fq &#...