1. seqkit 软件根据序列id,从fa文件中提取序列 conda install -c bioconda seqkit seqkit grep -f ge...
$ seqkit grep -f id.txt seqs.fq.gz -o result.fq.gz#按 ID 列表文件搜索(不包含空格) $ seqkit grep -i -f id.txt seqs.fq.gz -o result.fq.gz #-i 忽略大小写 $ seqkit grep -n -f name.txt seqs.fa.gz -o result.fa.gz #使用序列名称列表进行搜索(它们可能包含空格) $ cat hairpin....
seqkit translate test.fa --trim >protein.fa #去除* seqkit grep -f test_id.txt test.fa -o new_test.fa #根据id提取序列 seqkit seq hairpin.fa.gz -n -i #展示序列ID
序列信息统计 1## 序列碱基含量2seqkit fx2tab -l -g -n -i -H test.fa34## 序列长度的整体分布统计5seqkit stat test.fa 提取序列(grep) 1## 给定基因名字,gene.txt; 从基因所对应的fasta文件提取序列;2seqkit grep -f gene test.fa |seqkit seq -i >gene.fa 3 ## 参数 4 -i: 只输出ID,后...
seqkit grep -s -r -i -p ^atg cds.fa#选取有起始密码子的序列 seqkit grep -f list test.fa > new.fa#根据ID提取序列 seqkit grep -s -d -i -p TTSAA#简并碱基使用。S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 ...
seqkit sample -p 0.001 duplicated-reads.fq.gz 用于匹配需要的序列 按照文件中名字匹配(一行只能存储一个名字)seqkit grep -f id.txt duplicated-reads.fq.gz 注意保存序列名用seqkit seq -n - i,用seqkit fx2tab -n -i 在名字后面会带有空格 可依据名字或者序列移除重复序列 ...
seqkit grep -f list test.fa > new.fa 参考:https://blog.csdn.net/weixin_29148445/article/details/111931414最后编辑于 :2021.01.27 10:56:56 ©著作权归作者所有,转载或内容合作请联系作者 0人点赞 软件安装与使用 更多精彩内容,就在简书APP "小礼物走一走,来简书关注我"赞赏支持还没有人赞赏,支持一...
seqkitgrep 参数 代码语言:shell 复制 # 选取有起始密码子的序列seqkitgrep-s-r-i-p^atg ex.fa# 根据ID提取序列seqkitgrep-flist ex.fa>new.fa# 简并碱基使用。S 代表C or G.seqkitgrep-s-d-i-pTTSAA# 匹配限定到某区域seqkitgrep-s-R1:30-i-r-pGCTGG# ...
seqkit grep -f id.txt C1_1.fq.gz -o result.fq.gz # 使用序列名称列表进行搜索(它们可能包含空格) seqkit grep -n -f id.txt C1_1.fq.gz -o result.fa.gz zcat result.fa.gz # 提取hsa开头的序列 zcat hairpin.fa.gz | seqkit grep -r -p ^hsa |head ...
Could we have -f IDS.txt (could be regions, not just IDs) ? THis should be faster than seqkit grep ?tseemann changed the title Request: seqkit fadix -f <file_of_regions> Request: seqkit faidx -f <file_of_regions> Jun 22, 2021 Owner...