seqkit common test1.fa test2.fa -o common.fasta # By full name(整个序列的名字,包含description部分)。输出序列名字相同的。 seqkit common test1.fa test2.fa -n -o common.fasta # 输出要比较的文件中序列相同的序列 seqkit common test1.fa test2.fa -s -i -o common.fasta # 输出要比较的文件...
## 根据序列长度排序,也可seqkit sort -l$ zcat hairpin.fa.gz|seqkit fx2tab-l|sort-t"`echo -e '\t'`"-n-k4,4|seqkit tab2fx>cin-mir-4129MI0015684Cionaintestinalis miR-4129stem-loopUUCGUUAUUGGAAGACCUUAGUCCGUUAAUAAAGGCAUC>mmu-mir-7228MI0023723Musmusculus miR-7228stem-loopUGGCGACCUGAACAGA...
cat hairpin.fa | seqkit head -n 1 \ | seqkit duplicate -n 2 # 对重复序列改名,使其独一无二 cat hairpin.fa | seqkit head -n 1 \ | seqkit duplicate -n 2 | seqkit rename 1. 2. 3. 4. 5. 6. rmdup 通过id/名称/序列删除重复的序列 # 去除重复的序列 zcat hairpin.fa.gz | seqkit ...
输出序列名字相同的。seqkit common test1.fa test2.fa-n-ocommon.fasta# 输出要比较的文件中序列相同的序列seqkit common test1.fa test2.fa-s-i-ocommon.fasta# 输出要比较的文件中序列相同的序列 (for large sequences)seqkit common test1.fa test2.fa-s-i-ocommon.fasta--md5 2.7. 文件切割 代码语...
# 输出序列长度,GC含量,名字,IDseqkit fx2tab -l -g -n -i -H ex.fasta 2.3. 序列信息统计 # 序列长度分布统计seqkitstat[flags] 参数 # 统计信息seqkit stats *.f{a,q}.gz# 结果如下图 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa...
seqkit fx2tab -l -g -n -i -H test..fa (这些参数组合起来比较好看) 2.序列长度的整体分布统计 seqkit stat test.fa seqkit grep [flags] 参数: -n, --by-name 匹配整个序列的名字,包含deion部分,而不是序列id。 -s, --by-seq 匹配序列 ...
name/id排序,忽略大小写且无额外信息,或按序列长度排序 seqkit sort A1_1.fq.gz -n --quiet -o...
Seqkit translate是一款命令行工具,用于将DNA序列翻译成蛋白质序列。以下是Seqkit translate的一些用法及详细讲解: 基本用法 •命令格式:seqkit translate [options] •参数说明: –:输入文件,可以是DNA序列的FASTA/Q文件。 –-o, --out-file:指定输出文件名,默认为标准输出。 –-n:选择具有最长aa序列的记录。
seqkit seq hairpin.fa.gz -n -i --id-regexp "^[^\s]+\s([^\s]+)\s" | head 单行/多行转换 -s提取并展示序列 -w 代表每行的碱基数量,0代表不换行 #仅仅提取序列 -s seqkit seq gene.fa -s -w 0|head #--将多行序列转化为标准4行FASTQ ...
seqkit fx2tab -n -i -B A -B T duplicated-reads.fq.gz | head 用于从文件中取部分序列用于分析,可以按数量或者按比例选择。1.按照数量选择(数量不一定准确)seqkit sample -n 1000 duplicated-read.fa.gz | head 2.按照比例选择 seqkit sample -p 0.001 duplicated-reads.fq.gz 用于匹配...