6.faidx 建立索引文件、提取子序列 $seqkit faidxhairpin.fa #建立序列索引 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1 hsa-let-7a-2 #提取ID信息 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1 hsa-let-7a-2 -f # -f 标题全部输出 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1:1-10 #...
faidx-创建fasta索引文件并提取子序列Watch-统计序列长度分布的柱状图sana-清除打断的不好的单行的fastq文件2)格式转换fx2tab-将FASTA/Q 文件转变成制表符分割的形式 (1th: name/ID, 2nd: sequence, 3rd: quality)tab2fx-制表符分割的形式转为fasta/q格式fq2fa-fastq文件转为fasta文件convert-在Sanger, Solexa和...
seqkit faidx hairpin.fa hsa-let-7a-1 hsa-let-7a-2 -f # 提取序列并选择区域显示 seqkit faidx hairpin.fa hsa-let-7a-1:1-10 seqkit faidx hairpin.fa hsa-let-7a-1:-10--1 seqkit faidx hairpin.fa hsa-let-7a-1:1 # 检查hsa开头的序列并统计 seqkit faidx hairpin.fa hsa -r | seqkit st...
duplicate 重复序列N次 faidx 创建FASTA索引文件并提取子序列 fish 使用局部比对在较大的序列中寻找短序列 fq2fa 转换FASTQ到FASTA fx2tab 将FASTA/Q转换为表格格式(包含长度/GC含量/GC偏好) genautocomplete 生成shell自动完成脚本 grep 通过ID/name/sequence/sequence motif搜索序列,允许错配 head 打印第一条序列 he...
Basic: seq, stats, subseq, sliding, faidx, watch, sana, scat Format conversion: fq2fa, fx2tab, tab2fx, convert, translate Searching: grep, locate, amplicon, fish Set operation: sample, rmdup, common, duplicate, split, split2, head, head-genome, range, pair ...
faidx create the FASTA index file and extract subsequences scat real time recursive concatenation and streaming of fastx files seq transform sequences (extract ID, filter by length, remove gaps, reverse complement...) sliding extract subsequences in sliding windows ...
Usage:seqkit faidx [flags] <fasta-file> [regions...]Flags:-f, --full-head print full header line instead of just ID. New fasta index file ending with .seqkit.fai will be created-h, --help help for faidx-i, --ignore-case ignore case-r, --use-regexp IDs are regular expression. ...
支持索引建立和子序列提取,如faidx命令,以及fastq与fasta格式之间的转换。提供排序和匹配操作,如按照ID、名称或序列长度排序,以及使用grep进行精确或模糊的序列搜索。灵活的拆分功能:Seqkit的拆分功能可根据长度或特定规则进行,如按id或前三碱基进行拆分,满足用户多样化的需求。官方文档与教程:用户可以...
samtools faidx(seqkit faidx也可以) 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列.该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同.生成的fai文件共5列,\t分隔.写着写着感觉我好像在上一节写过...
I have a file of 2 million viral genomes. I need extract groups of sequences, usuaally ~1 to ~10,000. I was using seqkit frep -f IDS.txt but it can be slow. I indexed my FASTA with seqkit faidx seqkit faidx seqs.fasta $(cat IDS.txt) is c...