stats:简单统计FASTQ/FASTA文件。 subseq:按照region、GTF或BED获取子序列。 sum:计算FASTQ/FASTA文件中所有序列的消息摘要。 tab2fx:将表格格式转换为FASTQ/FASTA。 translate:将DNA/RNA翻译成蛋白质序列。 version:显示版本信息。 watch:实时监控序列文件的数据。 这些功能几乎涵盖了生物信息学的方方面面,从数据处理...
使用seqkit stats [flags]命令统计fasta/fastq格式及其压缩格式的DNA/RNA/Protein类型数据,统计指标包括序...
3. seqkit 统计fasta/fastq文件 # 单个文件统计seqkit stats Homo_sapiens.GRCh37.dna.primary_assembly.fa# file format type num_seqs sum_len min_len avg_len max_len# Homo_sapiens.GRCh37.dna.primary_assembly.fa FASTA DNA 84 3,101,804,739 4,262 36,926,246.9 249,250,621# 统计全部fq.gz 和...
seqkit stats C1_1.fq.gz #--输出结果tab分隔 seqkit stats C1_1.fq.gz -T #--输出文件转化其他格式 seqkit stats C1_1.fq.gz -T| csvtk pretty -t seqkit stats C1_1.fq.gz -T| csvtk csv2md -t # 统计更多信息 -a seqkit stats C1_1.fq.gz -a # j多线程加速,尤其是对于具有多个序列文...
seqkit split test.fa-p4将test.fa 分隔为4个部分 统计基因组/fq信息 seqkit stats *fq.gz ## 可以得到碱基数量等信息 最后编辑于:2025.01.24 13:20:58 ©著作权归作者所有,转载或内容合作请联系作者 2人点赞 零碎儿 更多精彩内容,就在简书APP "随缘" 赞赏支持还没有人赞赏,支持一下...
提取序列后,你可以使用其他生物信息学工具或脚本对序列进行进一步的分析或操作。例如,你可以使用seqkit stats来查看提取序列的统计信息: bash seqkit stats extracted_seq2.fasta 这将输出关于提取序列的一些基本统计信息,如序列长度、GC含量等。 希望这些步骤能帮助你成功地使用seqkit提取序列!
Basic: seq, stats, subseq, sliding, faidx, watch, sana, scat Format conversion: fq2fa, fx2tab, tab2fx, convert, translate Searching: grep, locate, amplicon, fish Set operation: sample, rmdup, common, duplicate, split, split2, head, head-genome, range, pair ...
# 统计信息seqkit stats *.f{a,q}.gz# 结果如下图 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa# 根据ID提取序列seqkit grep -f list ex.fa > new.fa# 简并碱基使用。S 代表C or G.seqkit grep -s -d -i -p TTSAA# 匹配限定到...
1. 统计fastq文件的信息 seqkit stats SRR6236885.sra.fastq -a 1. 选取部分fastq 按比例 seqkit sample SRR6236885.sra.fastq -p 0.01 -o sample.fastq 1. 按数量 seqkit sample SRR6236885.sra.fastq -n 100 -o sample-1.fastq 1. 但是这里不是精确的输入你自己指定的数字,这个帮助文档也提到了 ...
seqkit stats*.f{a,q}.gz # 结果如下图 示例 2.4. 根据ID提取序列 代码语言:javascript 复制 seqkit grep 参数 代码语言:javascript 复制 # 选取有起始密码子的序列 seqkit grep-s-r-i-p^atg ex.fa # 根据ID提取序列 seqkit grep-f list ex.fa>new.fa ...