1、cut:切分操作(可以切分出一整列) 2、grep:检索(可以使用正则表达式) 3、sort:排序(可以对整列排序) 4、wc:统计字符、字数、行数 5、uniq:去重(只去除连续的重复值) 6、tee:双向重定向 7、split:文件切分(按字节大小、按行等) 8、xargs:参数代换(结合pipe使用) 9、tr、替换、压缩和删除 2、具体操作...
1. seqkit 软件根据序列id,从fa文件中提取序列 conda install -c bioconda seqkit seqkit grep -f ge...
# 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa# 根据ID提取序列seqkit grep -f list ex.fa > new.fa# 简并碱基使用。S 代表C or G.seqkit grep -s -d -i -p TTSAA# 匹配限定到某区域seqkit grep -s -R 1:30 -i -r -p GCTGG# 2.5. motif定位 seqkit locate [flags]...
seqkit grep -s -r -i -p ^atg ex.fa # 根据ID提取序列 seqkit grep -f list ex.fa > new.fa # 简并碱基使用。S 代表C or G. seqkit grep -s -d -i -p TTSAA # 匹配限定到某区域 seqkit grep -s -R 1:30 -i -r -p GCTGG# 2.5. motif定位 seqkit locate [flags] 参数 seqkit loc...
seqkit 软件根据序列ID删除指定的序列 001、 单个删除 (base) [root@pc1 test1]# ls a.fa (base) [root@pc1 test1]# cat a.fa## 测试文件>chr1 tttcccggg>chr2 tttgggjjj cccjjjjjj>chr3 ccc>chr4 aaaaatt (base) [root@pc1 test1]# seqkit grep -v -p"chr1"a.fa## 删除chr1>chr2...
seqkit seq test.fa#查看 fa文件 seqkit translate test.fa > protein.fa #转化为蛋白序列 seqkit translate test.fa --trim >protein.fa #去除* seqkit grep -f test_id.txt test.fa -o new_test.fa #根据id提取序列 seqkit seq hairpin.fa.gz -n -i #展示序列ID...
seqkitgrep 参数 代码语言:shell 复制 # 选取有起始密码子的序列seqkitgrep-s-r-i-p^atg ex.fa# 根据ID提取序列seqkitgrep-flist ex.fa>new.fa# 简并碱基使用。S 代表C or G.seqkitgrep-s-d-i-pTTSAA# 匹配限定到某区域seqkitgrep-s-R1:30-i-r-pGCTGG# ...
2、序列长度分布统计 xUsage: seqkit stat [flags] 举例: seqkit stat test.fa 输出结果: 四、根据ID或特定的motif筛选提取序列 seqkit grep [flags] 参数: -n, --by-name 匹配整个序列的名字,包含deion部分,而不是序列id。 -s, --by-seq 匹配序列 ...
faidx 创建FASTA索引文件并提取子序列 fish 使用局部比对在较大的序列中寻找短序列 fq2fa 转换FASTQ到FASTA fx2tab 将FASTA/Q转换为表格格式(包含长度/GC含量/GC偏好) genautocomplete 生成shell自动完成脚本 grep 通过ID/name/sequence/sequence motif搜索序列,允许错配 ...
seqkit grep-f list test.fa>new.fa#根据ID提取序列 seqkit grep-s-d-i-p TTSAA#简并碱基使用。S 代表Cor G.seqkit grep-s-R1:30-i-r-p GCTGG##匹配限定到某区域 motif定位 对grep的拓展,可以正反链同时匹配,输出匹配的位置。 seqkit locate[flags]参数:-d,--degenerate ...