1.1 序列操作SeqKit提供了丰富的命令行选项,如 seqkit seq,让你轻松处理序列。例如,-p用于获取互补序列,--dna2rna转换DNA为RNA,-l转换为小写,-g移除组装序列中的间隙,-r反向序列,--rna2dna则用于RNA转DNA。你还可以控制每行输出的碱基数,如 seqkit seq ex.fasta -w 60,或者指定长度切分序列
# 单样本处理A1_1.fq.gz,过滤保留平均质量分数≥25的序列 seqkit seq -Q 25 A1_1.fq.gz -o A...
seqkit seq [flags] file 参数: -p, --complement 取互补序列 --dna2rna DNA to RNA -l, --lower-case 将序列以小写字母形式输出 -g, --remove-gaps 移除组装序列中的gap -r, --reverse 取反向序列 --rna2dna RNA to DNA -u, --upper-case 将序列以大写字母形式输出 ...
编辑和排序:replace修改序列,rename重命名,sort进行序列排序。 具体用法:通过添加环境变量调用,如`export PATH=path:$PATH`,并参照各种命令的参数选项进行操作,例如`seqkit seq -w 100 test.fa`以100碱基为行输出序列。例如,对文件进行长度统计和筛选特定序列:- seqkit fx2tab -l -g -n -i...
seqkit seq hairpin.fa.gz -r -p|head 删除gap/大小写转换 -g 去除序列中的间隔,将中间的横杠去掉 -u转化序列为大写字母展示 echo -e ">seq\nACGT-ACTGC-acc" | seqkit seq -g -u RNA转为DNA —rna2dna 将RNA序列转化为DNA序列 echo -e ">seq\nUCAUAUGCUUGUCUCAAAGAUUA" | seqkit seq --rna...
seqkit sample -p 0.001 duplicated-reads.fq.gz 用于匹配需要的序列 按照文件中名字匹配(一行只能存储一个名字)seqkit grep -f id.txt duplicated-reads.fq.gz 注意保存序列名用seqkit seq -n - i,用seqkit fx2tab -n -i 在名字后面会带有空格 可依据名字或者序列移除重复序列 ...
seqkit stats -a and seqkit seq -g -G: change default gap letters from '- ' to '- .' seqkit subseq: fix bug of range overflow when using -d/--down-stream or -u/--up-stream for retieving subseq using BED (--beb) or GTF (--gtf) file. seqkit locate: add flag -G/--non-gre...
-`seqkit bam`: new field`RightSoftClipSeq`.[#172](https://github.com/shenwei356/seqkit/pull/172) -`seqkit sample -2`: remove extra`\n`.[#173](https://github.com/shenwei356/seqkit/issues/173) -`seqkit split2 -l`: fix bug for splitting by accumulative length, this bug occurs whe...