-p 匹配模式,支持连续写多个模式,匹配任一模式即输出 -R 匹配位置选择 -r 使用正则表达式 # 选取有起始密码子的序列 seqkit grep -s -r -i -p ^atg ex.fa # 根据ID提取序列 seqkit grep -f list ex.fa > new.fa # 简并碱基使用。S 代表C or G. seqkit grep -s -d -i -p TTSAA # 匹配限...
-p search pattern/motif -f pattern/motif file (FASTA format) 代码语言:shell AI代码解释 seqkit locate -i -d -p AUGGACUN ex.fa 2.6. 多个文件寻找相同的序列 代码语言:shell AI代码解释 seqkit common [flags] 参数 参数 作用 -n 匹配整个序列的名字,包含description部分,而不是序列id -s ...
1.1 序列操作SeqKit提供了丰富的命令行选项,如 seqkit seq,让你轻松处理序列。例如,-p用于获取互补序列,--dna2rna转换DNA为RNA,-l转换为小写,-g移除组装序列中的间隙,-r反向序列,--rna2dna则用于RNA转DNA。你还可以控制每行输出的碱基数,如 seqkit seq ex.fasta -w 60,或者指定长度切...
seqkit grep -s -r -i -p ^atg cds.fa#选取有起始密码子的序列 seqkit grep -f list test.fa > new.fa#根据ID提取序列 seqkit grep -s -d -i -p TTSAA#简并碱基使用。S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 ...
$ seqkit split hairpin.fa.gz -s 10000 #将序列拆分为最多10000个序列的部分 $ seqkit split hairpin.fa.gz -p 4 #将序列拆分为4部分 $ seqkit split hairpin.fa.gz -p 4 -2#加上-2减少内存使用 $ seqkit split hairpin.fa.gz -i --id-regexp "^([\w]+)\-" -2 #按id拆分序列 $ seqkit...
# 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa# 根据ID提取序列seqkit grep -f list ex.fa > new.fa# 简并碱基使用。S 代表C or G.seqkit grep -s -d -i -p TTSAA# 匹配限定到某区域seqkit grep -s -R 1:30 -i -r -p GCTGG# ...
seqkit seq test.fa -r -p > test_re_com.fa 4.DNA序列转换为RNA序列 seqkit seq test.fa --nda2rna > test_rna.fa 5.RNA序列转换为DNA序列 seqkit seqtest.fa rna2dna > test_dna.fa 6.将序列以小写字母的形式输出 seqkit seq test.fa -l > test_lower.fa ...
seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 五、motif定位 对grep的拓展,可以正反链同时匹配,输出匹配的位置。 seqkit locate [flags] 参数: -d, --degenerate pattern/motif contains degenerate base -i, --ignore-case ignore case ...
安装:conda install seqkit ref: seqkit一个FASTA/Q序列处理神器 - 遗世独立的愚公 - 博客园 一、序列操作:1. 取反向序列 seqkit seq test.fa -r > test_re.fa 2. 取互补序列 seqkit seq test.fa -p >  ...
•-p -1:按照反向互补序列读取。 输出结果 •使用-o参数指定输出文件名。 •默认情况下,结果会输出到标准输出。 •示例:seqkit translate -o。 以上就是Seqkit translate的一些常见用法及详细讲解。通过Seqkit translate,我们可以方便地将DNA序列翻译成蛋白质序列,以便进行后续的蛋白质分析和研究工作。©...