[root@pc1 test4]#cat test.fa ## 测试fasta文件>contig_1 ATAGAGACGACC>contig_2 ATAGGACNNAGACACGTTAGAT>contig_3 TTGCACATATACATCATNNN>contig_4 GTATGAGCATAGACATACATC [root@pc1 test4]#seqkit grep-f list test.fa ## 提取contig[INFO]2patterns loadedfromfile>contig_1 ATAGAGACGACC>contig_3...
匹配序列 -d pattern/motif 包含简并碱基 -i 忽略大小写 -v 反向匹配 -p 匹配模式,支持连续写多个模式,匹配任一模式即输出 -R 匹配位置选择 -r 使用正则表达式 代码语言:javascript 复制 # 选取有起始密码子的序列 seqkit grep -s -r -i -p ^atg ex.fa # 根据ID提取序列 seqkit grep -f list ex.fa...
2.4. 根据ID提取序列 seqkit grep 参数 # 选取有起始密码子的序列seqkit grep -s -r -i -p ^atg ex.fa# 根据ID提取序列seqkit grep -f list ex.fa > new.fa# 简并碱基使用。S 代表C or G.seqkit grep -s -d -i -p TTSAA# 匹配限定到某区域seqkit grep -s -R 1:30 -i -r -p GCTGG#...
$ seqkit subseq --gtf t.gtf t.fa -u 3 -f #只取上游3bp序列 >seq_5:8:._usf:3 A ctg >seq_5:8:-_usf:3 B agt gff3 文件第九列格式为ID=XXXXX; gtf 文件第九列格式为 gene_id "A"; transcript_id ""; stats $ seqkit stats *.f{a,q}.gz #统计序列信息 file format type num_...
7. grep序列 zcat hairpin.fa.gz | seqkit grep -r -p ^hsa #提取ID开头为hsa的reads -v取想反zcat hairpin.fa.gz | seqkit grep -f list > new.fa #根据list取子集cat hairpin.fa.gz | seqkit grep -s -i -p aggcg #提取序列里有AGGCG的reads -m 允许误配的数量zcat hairpin.fa.gz | seqk...
seqkit sample -p 0.001 duplicated-reads.fq.gz 用于匹配需要的序列 按照文件中名字匹配(一行只能存储一个名字)seqkit grep -f id.txt duplicated-reads.fq.gz 注意保存序列名用seqkit seq -n - i,用seqkit fx2tab -n -i 在名字后面会带有空格 可依据名字或者序列移除重复序列 ...
6.faidx 建立索引文件、提取子序列 $ seqkit faidx hairpin.fa#建立序列索引$ seqkit faidx tests/hairpin.fa hsa-let-7a-1hsa-let-7a-2#提取ID信息$ seqkit faidx tests/hairpin.fa hsa-let-7a-1hsa-let-7a-2-f# -f 标题全部输出$ seqkit faidx tests/hairpin.fa hsa-let-7a-1:1-10#提取子序列第1...
# 提取1号染色体序列seqkit grep -p1Homo_sapiens.GRCh37.dna.primary_assembly.fa\-o Homo_sapiens....
seqkit grep 一条序列 Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。 grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,...
6.faidx 建立索引文件、提取子序列 $ seqkit faidx hairpin.fa #建立序列索引 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1 hsa-let-7a-2 #提取ID信息 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1 hsa-let-7a-2 -f # -f 标题全部输出 ...