# 输出序列长度,GC含量,名字,ID seqkit fx2tab -l -g -n -i -H ex.fasta 2.3. 序列信息统计 # 序列长度分布统计 seqkit stat [flags] 参数 # 统计信息 seqkit stats *.f{a,q}.gz # 结果如下图 示例 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列 seqkit grep -s -r -i -...
-b num:按字节切分<<=>>-c num:按字符切分 (2)grep 检索 -c :统计搜寻到的行数 -i:忽略大小写 -n :顺序输出行号 -v:反向输出(去掉不想要的内容) -w:匹配整个单词而不是一部分 (3)sort 排序(默认以字符串第一个字符从小到大排序) -f:忽略大小写 -M:以月份名称排序 -n:根据数值排序 -r:反向...
参数 # 输出序列长度,GC含量,名字,IDseqkit fx2tab -l -g -n -i -H ex.fasta 2.3. 序列信息统计 # 序列长度分布统计seqkitstat[flags] 参数 # 统计信息seqkit stats *.f{a,q}.gz# 结果如下图 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg e...
seqkit grep -f id.txt C1_1.fq.gz -o result.fq.gz # 使用序列名称列表进行搜索(它们可能包含空格) seqkit grep -n -f id.txt C1_1.fq.gz -o result.fa.gz zcat result.fa.gz # 提取hsa开头的序列 zcat hairpin.fa.gz | seqkit grep -r -p ^hsa |head # -v参数v用于移除序列 zcat hairp...
seqkit grep [flags] 参数: -n, --by-name 匹配整个序列的名字,包含deion部分,而不是序列id。 -s, --by-seq 匹配序列 -d, --degenerate pattern/motif 包含简并碱基 -i, --ignore-case 忽略大小写 -v, --invert-match 输出不匹配此模式的内容 ...
1. seqkit 软件根据序列id,从fa文件中提取序列 conda install -c bioconda seqkit seqkit grep -f ...
用于从文件中取部分序列用于分析,可以按数量或者按比例选择。1.按照数量选择(数量不一定准确)seqkit sample -n 1000 duplicated-read.fa.gz | head 2.按照比例选择 seqkit sample -p 0.001 duplicated-reads.fq.gz 用于匹配需要的序列 按照文件中名字匹配(一行只能存储一个名字)seqkit grep -f ...
seqkitgrep 参数 代码语言:shell 复制 # 选取有起始密码子的序列seqkitgrep-s-r-i-p^atg ex.fa# 根据ID提取序列seqkitgrep-flist ex.fa>new.fa# 简并碱基使用。S 代表C or G.seqkitgrep-s-d-i-pTTSAA# 匹配限定到某区域seqkitgrep-s-R1:30-i-r-pGCTGG# ...
seqkit grep 参数 参数作用 -n匹配整个序列的名字 -s匹配序列 -dpattern/motif 包含简并碱基 -i忽略大小写 -v反向匹配 -p匹配模式,支持连续写多个模式,匹配任一模式即输出 -R匹配位置选择 -r使用正则表达式 # 选取有起始密码子的序列 seqkit grep -s -r -i -p ^atg ex.fa # 根据ID提取序列 seqkit gre...
seqkit grep -f id.txt C1_1.fq.gz -o result.fq.gz # 使用序列名称列表进行搜索(它们可能包含空格) seqkit grep -n -f id.txt C1_1.fq.gz -o result.fa.gz zcat result.fa.gz # 提取hsa开头的序列 zcat hairpin.fa.gz | seqkit grep -r -p ^hsa |head ...