10. 输出反向互补序列 seqkit seq hairpin.fa.gz -r -p# >cel-let-7 MI0000001 Caenorhabditis elegans let-7 stem-loop# UCGAAGAGUUCUGUCUCCGGUAAGGUAGAAAAUUGCAUAGUUCACCGGUGGUAAUAUUCC#AAACUAUACAACCUACUACCUCACCGGAUCCACAGUGUA 11. grep 提取gtf指定染色体注释信息 # 提取1号染色体gtf注释zcat Homo_sapien...
对于按指定数量N采子样,seqkit sample命令先根据总数计算比例P,再按比例P执行采样。由于使用pseudorandom...
seqkit grep[flags]参数:-n,--by-name 匹配整个序列的名字,包含description部分,而不是序列id。-s,--by-seq 匹配序列-d,--degenerate pattern/motif 包含简并碱基-i,--ignore-case忽略大小写-v,--invert-match 输出不匹配此模式的内容-p,匹配模式,支持连续写多个模式,匹配任一模式即输出。如-p^ATG-p TAA...
-p匹配模式,支持连续写多个模式,匹配任一模式即输出 -R匹配位置选择 -r使用正则表达式 # 选取有起始密码子的序列 seqkit grep -s -r -i -p ^atg ex.fa # 根据ID提取序列 seqkit grep -f list ex.fa > new.fa # 简并碱基使用。S 代表C or G. seqkit grep -s -d -i -p TTSAA # 匹配限定到...
# 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa# 根据ID提取序列seqkit grep -f list ex.fa > new.fa# 简并碱基使用。S 代表C or G.seqkit grep -s -d -i -p TTSAA# 匹配限定到某区域seqkit grep -s -R 1:30 -i -r -p GCTGG# ...
seqkit grep -s -d -i -p TTSAA#简并碱基使用。S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 五、motif定位 对grep的拓展,可以正反链同时匹配,输出匹配的位置。 seqkit locate [flags] 参数: -d, --degenerate ...
seqkit grep 参数 代码语言:javascript 复制 # 选取有起始密码子的序列 seqkit grep-s-r-i-p^atg ex.fa # 根据ID提取序列 seqkit grep-f list ex.fa>new.fa # 简并碱基使用。S代表CorG.seqkit grep-s-d-i-pTTSAA# 匹配限定到某区域 seqkit grep-s-R1:30-i-r-pGCTGG# ...
seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 五、motif定位 对grep的拓展,可以正反链同时匹配,输出匹配的位置。 seqkit locate [flags] 参数: -d, --degenerate pattern/motif contains degenerate base -i, --ignore-case ignore case ...
1.3 从ID提取序列和motif定位SeqKit的 grep命令允许你根据ID、正则表达式或特定模式精准提取序列,而 locate则用于motif定位,支持模糊匹配和正向/反向搜索。1.4 文件操作:查找相同序列与切割文件当你需要比较多个文件中相同序列时,common命令能帮到你,它可以按ID或全名匹配,同时提供内存优化选项。此外,...
- seqkit fx2tab -l -g -n -i -H test.fa 显示序列长度和GC含量。- seqkit grep -s -p ^atg cds.fa 选取有起始密码子的序列。Seqkit的灵活性和效率使得在处理生物序列数据时成为不可或缺的工具,无论是数据预处理、分析,还是进行特定操作,它都能提供便利。