3. seqkit 统计fasta/fastq文件 # 单个文件统计seqkit stats Homo_sapiens.GRCh37.dna.primary_assembly.fa# file format type num_seqs sum_len min_len avg_len max_len# Homo_sapiens.GRCh37.dna.primary_assembly.fa FASTA DNA 84 3,101,804,739 4,262 36,926,246.9 249,250,621# 统计全部fq.gz 和...
这个代码块中,首先检查变量l是否为空,如果不为空, 则输出上一个序列的ID和长度。 然后,使用sub()...
输出所有统计数据,包括 seq 长度的四分位数、sum_gap、N50 代码语言:javascript 复制 # 统计信息 seqkit stats *.f{a,q}.gz # 结果如下图 示例 2.4. 根据ID提取序列 代码语言:javascript 复制 seqkit grep 参数 参数 作用 -n 匹配整个序列的名字 -s 匹配序列 -d pattern/motif 包含简并碱基 -i 忽略...
1.2 格式转换与信息统计SeqKit的转换功能强大,如 fa2fa命令可快速将FASTQ转换为FASTA,而 fx2tab则可以统计碱基含量、长度、ID等信息。通过 stat和 stats命令,你可以分析序列长度分布、四分位数、N50等统计数据。1.3 从ID提取序列和motif定位SeqKit的 grep命令允许你根据ID、正则表达式或特定模式精准提...
seqkit stats: Add columnN50_num, an alias of L50,#15. seqkit seq/locate/fish/watch: Removing the flag-V/--validate-seq-length. Now the whole sequence will be checked if-v/--validate-seqis given. seqkit amplicon: Fix the speed problem, introduced in v2.7.0.#439. ...
seqkit stats *.f{a,q}.gz # 结果如下图 示例 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列 seqkit grep -s -r -i -p ^atg ex.fa # 根据ID提取序列 seqkit grep -f list ex.fa > new.fa # 简并碱基使用。S 代表C or G. ...
-a输出所有统计数据,包括 seq 长度的四分位数、sum_gap、N50 # 统计信息 seqkit stats *.f{a,q}.gz # 结果如下图 示例 2.4. 根据ID提取序列 seqkit grep 参数 参数作用 -n匹配整个序列的名字 -s匹配序列 -dpattern/motif 包含简并碱基 -i忽略大小写 ...
# 统计信息seqkit stats *.f{a,q}.gz# 结果如下图 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa# 根据ID提取序列seqkit grep -f list ex.fa > new.fa# 简并碱基使用。S 代表C or G.seqkit grep -s -d -i -p TTSAA# 匹配限定到...
seqkit stats: Add column N50_num, an alias of L50, #15.seqkit seq/locate/fish/watch: Removing the flag -V/--validate-seq-length. Now the whole sequence will be checked if -v/--validate-seq is given.seqkit amplicon: Fix the speed problem, introduced in v2.7.0. #439. Slightly...
Projects Security Insights Additional navigation options master 1Branch 0Tags Code This branch is23 commits behindshenwei356/seqkit:master. Folders and files Name Last commit message Last commit date Latest commit shenwei356 Attentions -> Attention ...