seqkit common test1.fa test2.fa -o common.fasta # By full name(整个序列的名字,包含description部分)。输出序列名字相同的。 seqkit common test1.fa test2.fa -n -o common.fasta # 输出要比较的文件中序列相同的序列 seqkit common test1.fa test2.fa -s -i -o common.fasta # 输出要比较的文件...
## 根据序列长度排序,也可seqkit sort -l$ zcat hairpin.fa.gz|seqkit fx2tab-l|sort-t"`echo -e '\t'`"-n-k4,4|seqkit tab2fx>cin-mir-4129MI0015684Cionaintestinalis miR-4129stem-loopUUCGUUAUUGGAAGACCUUAGUCCGUUAAUAAAGGCAUC>mmu-mir-7228MI0023723Musmusculus miR-7228stem-loopUGGCGACCUGAACAGA...
cat hairpin.fa | seqkit head -n 1 \ | seqkit duplicate -n 2 # 对重复序列改名,使其独一无二 cat hairpin.fa | seqkit head -n 1 \ | seqkit duplicate -n 2 | seqkit rename 1. 2. 3. 4. 5. 6. rmdup 通过id/名称/序列删除重复的序列 # 去除重复的序列 zcat hairpin.fa.gz | seqkit ...
输出序列名字相同的。seqkit common test1.fa test2.fa-n-ocommon.fasta# 输出要比较的文件中序列相同的序列seqkit common test1.fa test2.fa-s-i-ocommon.fasta# 输出要比较的文件中序列相同的序列 (for large sequences)seqkit common test1.fa test2.fa-s-i-ocommon.fasta--md5 2.7. 文件切割 代码语...
# 输出序列长度,GC含量,名字,IDseqkit fx2tab -l -g -n -i -H ex.fasta 2.3. 序列信息统计 # 序列长度分布统计seqkitstat[flags] 参数 # 统计信息seqkit stats *.f{a,q}.gz# 结果如下图 2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa...
seqkit fx2tab -l -g -n -i -H test..fa (这些参数组合起来比较好看) 2.序列长度的整体分布统计 seqkit stat test.fa seqkit grep [flags] 参数: -n, --by-name 匹配整个序列的名字,包含deion部分,而不是序列id。 -s, --by-seq 匹配序列 ...
Seqkit translate是一款命令行工具,用于将DNA序列翻译成蛋白质序列。以下是Seqkit translate的一些用法及详细讲解: 基本用法 •命令格式:seqkit translate [options] •参数说明: –:输入文件,可以是DNA序列的FASTA/Q文件。 –-o, --out-file:指定输出文件名,默认为标准输出。 –-n:选择具有最长aa序列的记录。
seqkit fx2tab -n -i -B A -B T duplicated-reads.fq.gz | head 用于从文件中取部分序列用于分析,可以按数量或者按比例选择。1.按照数量选择(数量不一定准确)seqkit sample -n 1000 duplicated-read.fa.gz | head 2.按照比例选择 seqkit sample -p 0.001 duplicated-reads.fq.gz 用于匹配...
-n, --by-name 匹配整个序列的名字,包含description部分,而不是序列id。 -s, --by-seq 匹配序列 -d, --degenerate pattern/motif 包含简并碱基 -i, --ignore-case 忽略大小写 -v, --invert-match 输出不匹配此模式的内容 -p, 匹配模式,支持连续写多个模式,匹配任一模式即输出。如-p ^ATG -p TAA$...
duplicate 重复序列N次 faidx 创建FASTA索引文件并提取子序列 fish 使用局部比对在较大的序列中寻找短序列 fq2fa 转换FASTQ到FASTA fx2tab 将FASTA/Q转换为表格格式(包含长度/GC含量/GC偏好) genautocomplete 生成shell自动完成脚本 grep 通过ID/name/sequence/sequence motif搜索序列,允许错配 ...