seqkit seq test.fa -s -w 20 -o test_20.fa 二、Fasta/q之间以及与tab格式互换 10.将fataq文件转化为fasta格式. seqkit seq fq2fa test.fq -o test.fa 11.将fasta格式转化为tab格式 seqkit fx2tab test.fa > test_tab.fa (没有seq参数) 三、序列信息统计 1.序列碱基含量 seqkit fx2tab -l -g ...
seqkit seq [flags] file 参数 # 将序列转换为一行输出 seqkit seq ex.fasta -w 0 > test.fasta # 每行输出指定碱基n seqkit seq -w n ex.fasta # DNA序列转换为RNA序列 seqkit seq --dna2rna ex.fasta # 取反向互补,切每行100碱基 seqkit seq -w 100 -p -r ex.fasta> test.fasta 2.2. 格式...
seqkit grep [flags] 参数: -n, --by-name 匹配整个序列的名字,包含description部分,而不是序列id。 -s, --by-seq 匹配序列 -d, --degenerate pattern/motif 包含简并碱基 -i, --ignore-case 忽略大小写 -v, --invert-match 输出不匹配此模式的内容 -p, 匹配模式,支持连续写多个模式,匹配任一模式即...
seqkit grep [flags] 参数: -n, --by-name 匹配整个序列的名字,包含description部分,而不是序列id。 -s, --by-seq 匹配序列 -d, --degenerate pattern/motif 包含简并碱基 -i, --ignore-case 忽略大小写 -v, --invert-match 输出不匹配此模式的内容 -p, 匹配模式,支持连续写多个模式,匹配任一模式即...
参数 Flags: --alphabet-guess-seq-length int seqkit根据第一个FASTA记录猜测序列类型的序列前缀的长度(0表示整个序列)(默认10000) -h, --help 显示帮助 --id-ncbi FASTA头是ncbi风格的,例如>gi|110645304|ref|NC_002516.2 --id-regexp string 用于解析ID的正则表达式(default "^(\\S+)\\s?"),匹配空格...
seqkit sort --quiet -i #不区分大小写 >seq1 ACGTNcccc >SEQ2 acgtnAAAA $ echo -e ">seq1\nACGTNcccc\n>SEQ2\nacgtnAAAAnnn\n>seq3\nacgt" | seqkit sort --qui et -l #按序列长度 >seq3 acgt >seq1 ACGTNcccc >SEQ2 acgtnAAAAnnn 0.9.0版本中加入 -r 参数,可以反转排序结果。发...
# -j 参数会并行运算更快速度 seqkit seq hairpin.fa.gz -n #打印序列ID全名 seqkit seq hairpin.fa.gz -n -i #只打印ID seqkit seq hairpin.fa.gz -n -i --id-regexp ... #通过正则去打印ID中内容(适用于所有的子命令) seqkit seq hairpin.fa.gz -s -w 0 #只打印序列(全局标志-w定义输出行...
seqkit seq test.fa -l > test_lower.fa ## 大写字母输出 seqkit seq test.fa -u > test_upper.fa ## 指定每行序列的输出长度(为0的话,代表为一整行,默认的输出 长度是60个碱基) seqkit seq test.fa -w 10 > test_10.fa (指定序列的长度为10...
编辑和排序:replace修改序列,rename重命名,sort进行序列排序。 具体用法:通过添加环境变量调用,如`export PATH=path:$PATH`,并参照各种命令的参数选项进行操作,例如`seqkit seq -w 100 test.fa`以100碱基为行输出序列。例如,对文件进行长度统计和筛选特定序列:- seqkit fx2tab -l -g -n -i...