echo-e">seq\nACGT-ACTGC-ACC"|seqkit seq -g -u# >seq# ACGTACTGCACC 8. 使用序列长度过滤fasta文件 -m 最小长度, -M 最大长度 cat hairpin.fa|seqkit seq -m100-M 1000|seqkit stats# 文件格式类型num_seqs sum_len min_len avg_len max_len#- FASTA RNA 10,972 1560270 100 142.2 938 9....
2.1. 序列操作 seqkit seq [flags] file 参数 # 将序列转换为一行输出 seqkit seq ex.fasta -w 0 > test.fasta # 每行输出指定碱基n seqkit seq -w n ex.fasta # DNA序列转换为RNA序列 seqkit seq --dna2rna ex.fasta # 取反向互补,切每行100碱基 seqkit seq -w 100 -p -r ex.fasta > test....
seqkit seq hairpin.fa.gz -r -p|head 1. 2. 删除gap/大小写转换 -g 去除序列中的间隔,将中间的横杠去掉 -u转化序列为大写字母展示 echo -e ">seq\nACGT-ACTGC-acc" | seqkit seq -g -u 1. RNA转为DNA —rna2dna 将RNA序列转化为DNA序列 echo -e ">seq\nUCAUAUGCUUGUCUCAAAGAUUA" | seqk...
seqkit seq C1_1.fq.gz -w 0|head 反向/互补 -r 序列反向 -p序列互补 # 序列反向互补,-r反向,-p互补 seqkit seq hairpin.fa.gz -r -p|head 删除gap/大小写转换 -g 去除序列中的间隔,将中间的横杠去掉 -u转化序列为大写字母展示 echo -e ">seq\nACGT-ACTGC-acc" | seqkit seq -g -u ...
-g, --remove-gaps 移除组装序列中的gap -r, --reverse 取反向序列 --rna2dna RNA to DNA -u, --upper-case 将序列以大写字母形式输出 -w, --line-width int 以每行指定长度输出序列 (0 for no wrap) (default 60) 举例: seqkit seq test.fa -w 0#将此文件fasta序列转换成一行输出 ...
$ seqkit seq *.fa -l > out #将序列以小写字母的形式输出 $ seqkit seq *.fa -u > out #将序列以大写字母的形式输出 $ seqkit seq *.fa -w 10 > out #(指定序列的长度为10)指定每行序列的输出长度(为0的话,代表为一整行,默认的输出 长度是60个碱基) $ seqkit seq *...
seqkit seq [flags] file 参数 参数作用 -p取互补序列 --dna2rnaDNA to RNA -l序列以小写字母输出 -g移除组装序列中的gap -r取反向序列 --rna2dnaRNA to DNA -u序列以大写字母输出 -w每行指定长度数据序列(default=60) # 将序列转换为一行输出 seqkit seq ex.fasta -w 0 > test.fasta # 每行输出...
seqkit seq [flags] file 参数 # 将序列转换为一行输出seqkitseqex.fasta -w 0 > test.fasta# 每行输出指定碱基nseqkitseq-w n ex.fasta# DNA序列转换为RNA序列seqkitseq--dna2rna ex.fasta# 取反向互补,切每行100碱基seqkitseq-w 100 -p -r ex.fasta > test.fasta ...
seqkit fx2tab test.fa > test_tab.fa (没有seq参数) 三、序列信息统计 1.序列碱基含量 seqkit fx2tab -l -g -n -i -H test.fa 2.序列长度的整体分布统计 seqkit stat test.fa 四、grep 序列匹配 seqkit grep [flags] 参数: -n, --by-name ...
-g, --remove-gaps 移除组装序列中的gap -r, --reverse 取反向序列 --rna2dna RNA to DNA -u, --upper-case 将序列以大写字母形式输出 -w, --line-width int 以每行指定长度输出序列 (0 for no wrap) (default 60) 举例: seqkit seq test.fa -w 0#将此文件fasta序列转换成一行输出 ...