1)序列和子序列seq-转换序列(序列颠倒,序列互补等)subseq-从区域/gtf/bed中获得序列,包括侧翼的序列sliding-滑动窗口取序列,支持环式基因组stats- 对FASTA/Q 文件进行简单统计faidx-创建fasta索引文件并提取子序列Watch-统计序列长度分布的柱状图sana-清除打断的不好的单行的fastq文件2)格式
注意事项 在使用 seqkit subseq 命令之前,建议对输入文件 input.fasta 建立索引,以提高提取效率。可以使用 samtools faidx input.fasta 命令来建立索引。 区间坐标是基于1的索引,即第一个碱基的位置是1,而不是0。 通过以上步骤,您可以使用 seqkit 区间命令来准确地提取特定区域的序列。
6.faidx 建立索引文件、提取子序列 $ seqkit faidx hairpin.fa #建立序列索引 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1 hsa-let-7a-2 #提取ID信息 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1 hsa-let-7a-2 -f # -f 标题全部输出 $ seqkit faidx tests/hairpin.fa hsa-let-7a-1:1-10...
6.将序列以小写字母的形式输出 seqkit seq test.fa -l > test_lower.fa 7.将序列以大写字母的形式输出 seqkit seq test.fa -u > test_upper.fa 8.指定每行序列的输出长度(为0的话,代表为一整行,默认的输出 长度是60个碱基) seqkit seq test.fa -w 10 > test_10.fa #指定序列的长度为10 9.将多...
faidx 创建FASTA索引文件并提取子序列 fish 使用局部比对在较大的序列中寻找短序列 fq2fa 转换FASTQ到FASTA fx2tab 将FASTA/Q转换为表格格式(包含长度/GC含量/GC偏好) genautocomplete 生成shell自动完成脚本 grep 通过ID/name/sequence/sequence motif搜索序列,允许错配 ...
concat 连接多个文件中具有相同ID的序列 convert 转换FASTQ质量编码格式:支持格式包括:桑格,Solexa和Illumina duplicate 重复序列N次 faidx 创建FASTA索引文件并提取子序列 fish 使用局部比对在较大的序列中寻找短序列 fq2fa 转换FASTQ到FASTA fx2tab 将FASTA/Q转换为表格格式(包含长度/GC含量/GC偏好) ...
比如,subseq提取: seqkit subseq --bed x.bed x.fasta #根据bed文件提取序列 seqkit subseq -r 1:12 x.fasta #提取每条序列的前12个核苷酸 fastq到fasta的格式转换: seqkit fq2fa x.fq.gz -o x.fa.gz 以及建索引: seqkit faidx x.fa 查看fq文件: ...
with .seqkit.fai will be created-h, --help help for faidx-i, --ignore-case ignore case-r, --use-regexp IDs are regular expression. But subseq region is not suppored here.seqkit faidx tests/hairpin.fa hsa-let-7a-1 hsa-let-7a-2 #提取指定序列 -f 输出ID全名 1:10 输出相应位置序列...
Seqkit提供了丰富的功能,包括序列查看、操作、转换等,如Seq命令。支持子序列提取、翻译、合并、统计等实用功能,例如使用seqkit stats命令可以高效统计序列文件。支持索引建立和子序列提取,如faidx命令,以及fastq与fasta格式之间的转换。提供排序和匹配操作,如按照ID、名称或序列长度排序,以及使用grep进行...
序列与子序列操作:包含操作如seq、subseq、sliding、stats、faidx等。格式转换:功能有fx2tab、tab2fx、fq2fa等。序列搜索:提供grep、locate 和 fish等命令。集合操作:如head、range、sample等。编辑操作:包含replace、rename等。排序操作:支持sort对序列进行灵活的排序。△ 具体使用方法 Seqkit可以通过命令行工具高效...