-f num:显示num字段的内容【n-;n-m;-m;m,n】 -b num:按字节切分<<=>>-c num:按字符切分 (2)grep 检索 -c :统计搜寻到的行数 -i:忽略大小写 -n :顺序输出行号 -v:反向输出(去掉不想要的内容) -w:匹配整个单词而不是一部分 (3)sort 排序(默认以字符串第一个字符从小到大排序) -f:忽略大...
Seqkit是一款专门处理fsata/q序列文件的软件,由go语言编写,功能比较完善,软件使用也很稳定。 优点1.能够非常全面的处理fasta/q文件,运行速度超快的序列工具...
seqkit grep -s -r -i -p ^atg cds.fa#选取有起始密码子的序列 seqkit grep -f list test.fa > new.fa#根据ID提取序列 seqkit grep -s -d -i -p TTSAA#简并碱基使用。S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 五、motif定位 对grep的拓展,可以正反...
再使用CD-hit 命令默认参数将序列进行去重复 然后使用seqkit seq -i 获取序列的id 再使用seqkit grep -f 获取原先每个bin中的fasta序列 注:转成氨基酸序列后,保证了序列相似度识别的准确性,再进行去冗余后可以尽可能保证剩余序列的唯一性
1. seqkit 软件根据序列id,从fa文件中提取序列 conda install -c bioconda seqkit seqkit grep -f ...
seqkit stats *.f{a,q}.gz # 结果如下图 示例 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列 seqkit grep -s -r -i -p ^atg ex.fa # 根据ID提取序列 seqkit grep -f list ex.fa > new.fa # 简并碱基使用。S 代表C or G. ...
可用命令sed来提取关键字下一行,命令如下:sed -n '/EVM0068010/{n;p}' upstream_2kb.fasta /关键...
seqkit grep -s -r -i -p ^atg cds.fa#选取有起始密码子的序列 seqkit grep -f list test.fa > new.fa#根据ID提取序列 seqkit grep -s -d -i -p TTSAA#简并碱基使用。S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 ...
seqkit grep -s -r -i -p ^atg cds.fa#选取有起始密码子的序列 seqkit grep -f list test.fa > new.fa#根据ID提取序列 seqkit grep -s -d -i -p TTSAA#简并碱基使用。S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 ...
seqkit grep -s -r -i -p ^atg cds.fa#选取有起始密码子的序列 seqkit grep -f list test.fa > new.fa#根据ID提取序列 seqkit grep -s -d -i -p TTSAA#简并碱基使用。S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 ...