seqkit seq --dna2rna test.fa#将此文件fasta序列dna转换成rna seqkit seq -w 100 -p -r test.fa#将此文件fasta序列反向互补输出,每行100碱基 二、Fasta/q之间及与tab格式互换 1、FASTQ转换成FASTA: seqkit fq2fa 举例: seqkit fq2fa reads_1.fq -o reads_1.fa 2、FASTA/FASTQ转换成tab格式。seqkit ...
seqkit seq -w n ex.fasta # DNA序列转换为RNA序列 seqkit seq --dna2rna ex.fasta # 取反向互补,切每行100碱基 seqkit seq -w 100 -p -r ex.fasta > test.fasta 2.2. 格式转换 fa2fa # fastq 转换为 fasta seqkit fq2fa ex1.fq -o ex2.fa # FASTA/FASTQ 转换成 tab 格式 seqkit fx2tab ex...
如随机抽取10000条FASTQ序列做NT污染评估。同时他也可以对FASTA序列提取 seqkit sample [flags] 参数: -n, --number int sample by number (result may not exactly match) -p, --proportion float sample by proportion -s, --rand-seed int rand seed for shuffle (default 11) ...
seqkit seq --dna2rna test.fa#将此文件fasta序列dna转换成rna seqkit seq -w 100 -p -r test.fa#将此文件fasta序列反向互补输出,每行100碱基 二、Fasta/q之间及与tab格式互换 1、FASTQ转换成FASTA: seqkit fq2fa 举例: seqkit fq2fa reads_1.fq -o reads_1.fa 2、FASTA/FASTQ转换成tab格式。seqkit ...
1、FASTQ转换成FASTA: seqkit fq2fa 举例: seqkit fq2fa reads_1.fq -o reads_1.fa 2、FASTA/FASTQ转换成tab格式。seqkit fx2tab 举例: seqkit fx2tab test.fa>test.fa.tab.fa seqkit fx2tab test.fq>test.fq.tab.fq tab格式:ID sequence
之间处理fasta或者fastq时总是自己进行写脚本,比如:fasta-fastaq的转化,根据名称调取fasta序列等;自从发现了seqkit,着实方便,再也不用费时间写脚本。 安装 conda install seqkit 使用 序列操作 (seq) ## 取反向序列seqkit seq test.fa-r>test_re.fa## 取互补序列seqkit seq test.fa-p>test_com.fa## 取反向...
fq2fa 转换FASTQ到FASTA fx2tab 将FASTA/Q转换为表格格式(包含长度/GC含量/GC偏好) genautocomplete 生成shell自动完成脚本 grep 通过ID/name/sequence/sequence motif搜索序列,允许错配 head 打印第一条序列 help 打印帮助信息 locate 定位序列,或者motifs,允许错配 ...
创建FASTA index file,并提取序列,比samtools faidx快,且功能多一点 二、格式转换 转FASTA/Q为表格格式,可附带序列长度,GC含量等信息,非常有用 转表格格式回FASTA/Q 转FASTQ为FASTA FASTQ质量编码相互转换(Sanger, Solexa and Illumina) 三、搜索 通过命令/序列/序列motif来搜索序列 ...
# fastq 转换为 fastaseqkit fq2fa ex1.fq -o ex2.fa# FASTA/FASTQ 转换成 tab 格式seqkit fx2tab ex.fa > test.fa.tab.fa seqkit fx2tab ex.fq > test.fq.tab.fq # 序列碱基含量及序列长度信息统计seqkit fx2tab [flags] 参数 # 输出序列长度,GC含量,名字,IDseqkit fx2tab -l -g -n -i -H...
fastq 转换fasta seqkit fq2fa sample-1.fastq -o sample-1.fasta 1. 根据id 提取序列 fasta fastq好像也可以 seqkit grep sample-1.fasta -f id.list 1. id只是一部分好像也可以 比如我这里fasta文件 的完整id是 SRR6236885.sra.9047 3a19e708-9d65-4f29-a332-d2e9a2b39234_Basecall_Alignmen...