seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 2.sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 #可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3.subseq 提取序列 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk ...
将fastq序列做反向互补分析: seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 案例2:sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 案例3:subseq 提取序列 根据输入的bed文件信息...
$ zcat hairpin.fa.gz|seqkit subseq-r1:12后12碱基 zcat hairpin.fa.gz|seqkit subseq-r-12:-1过滤前后12碱基 zcat hairpin.fa.gz|seqkit subseq-r13:-13通过gtf文件得到序列 seqkit subseq--gtf t.gtf t.fa 通过bed文件得到序列并移除重复序列 seqkit subseq--bedHomo_sapiens.GRCh38.84.bed.gz--chr1hsa...
seqtk sample-s100 Sample_R1.fq.gz10000# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 代码语言:javascript 复制 # 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseqin.fa reg.bed>out.fa # 根据输入的name li...
2. 得到互补序列 seqtk seq -r in.fq > out.fq # 此处的输入/输出文件也可以是fa格式 3. 根据reads ID 提取 reads seqtk subseq in.fq name.id > out.fq 4. 根据 bed 文件提取指定 reads seqtk subseq in.fa reg.bed > out.fa 5.sample ...
2.得到反向互补序列 seqtk seq -Ar input.fastq > output.fasta 3.seqtk comp: 得到fastq/fasta 文件的碱基组成 (输出格式:序列id 序列长度 A C G T ) seqtk comp in.fa > out.fa 4.subseq 根据name.list(不带>符号)提取子序列 -l可设定输出的每行长度 ...
# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 # 根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseq in.fa reg.bed > out.fa # 根据输入的name list,提取相应名称序列: ...
$seqtk subseq Usage: seqtk subseq [options] <in.fa> <in.bed>|<name.list> #提取name.list中指定名称的fa序列, Options: -t TAB delimited output# 输出以tab分割 -l INT sequence line length [0]# 输出序列以长度INT换行 Note: Use 'samtools faidx' if only a few regions are intended.#注意:...
06. 对FASTA/FASTQ序列做反向互补 seqtk seq -r in.fq > out.fq 07. 根据输入的name.lst文件内容提取对应序列,name.lst文件格式为每行一个序列名; seqtk subseq in.fq name.lst > out.fq 08. 根据输入的reg.bed文件内容提取对应固定区域(region)序列; ...
subseq如果你只想提取某几条序列/或者某一段区间里的序列,那么就可以使用这个命令;也可以指定一行输出(-t) 代码语言:javascript 复制 >echo"A00679:63:HGVWCDSXX:4:1403:24569:25911"|seqtk subseq-t test.fq-@A00679:63:HGVWCDSXX:4:1403:24569:25911ATTCACTCATGTACACCTTTCTTCCTCCTCTCTTCATCTCCTATCCCAAATAT...