2. 对 fq 文件进行质量过滤 3. 对碱基反向互补 4. 对 reads 的开头末尾进行 trim 5. 对 fq 文件进行随机取样 常用代码 1. fastq 转换成 fasta seqtk seq -a in.fq.gz > out.fa # 根据质量进行简单过滤,碱基质量低于q20的被小写 seqtk seq ...
我们可以将fastq文件长序列折叠成多行短序列(-l),反向互补(-r),并生成fasta文件(-A) 代码语言:javascript 代码运行次数:0 运行 AI代码解释 >head-8test.fq@A00679:63:HGVWCDSXX:4:1271:5927:18176CGTTGAGATGACGCTAGTCGCGTTGTGCCGGCCAAGGCGGCGGCGGCGGTTGAGCCAGAGAGTTAGAGGCGGCTCTGTTGCTGCGGTTTTCGCGACGGAGGCGGCC...
得到反向互补序列: seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 2.sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 #可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。
seqtk seq-a Sample_R1.fq.gz>Sample_R1.fa 将fastq序列做反向互补分析: seqtk seq-r Sample_R1.fq.gz>Sample_Revc_R1.fq 2. sample 随机抽样 代码语言:javascript 代码运行次数:0 运行 AI代码解释 seqtk sample-s100 Sample_R1.fq.gz10000# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的...
seqtk seq : 用途: 1)将fastq 文件转换成fasta 文件 seqtk seq -A input.fastq > output.fasta input.fastq的内容: @NB001 ATGCACAAAACCCC+/// output.fasta 的内容: >NB001 ATGCACAAAACCCC 2)得到反向互补序列 seqtk seq -Ar input.fastq > output.fasta output.fasta的内容...
将fastq序列做反向互补分析: seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 案例2:sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 案例3:subseq 提取序列 根据输入的bed文件...
Seqtk、Seqkit两个处理fa/fq神器的学习记录 Seqtk 安装# Conda也可 git clone https://github.com/lh3/seqtkcd seqtkmake 1.将fastq 文件转换成fasta 文件 seqtk seq -A input.fastq > output.fasta 2.得到反向互补序列 seqtk seq -Ar input.fastq > output.fasta ...
06. 对FASTA/FASTQ序列做反向互补 seqtk seq -r in.fq > out.fq 07. 根据输入的name.lst文件内容提取对应序列,name.lst文件格式为每行一个序列名; seqtk subseq in.fq name.lst > out.fq 08. 根据输入的reg.bed文件内容提取对应固定区域(region)序列; ...
[s20223040682@admin2 test]$wc-l sub*40sub1.fastq40sub2.fastq80总用量 。 004、提取reads的反向互补序列 seqtk seq -r SRR1770413_1.fastq 005、根据readID提取数据
反向互补 FASTA/Q: seqtk seq -r in.fq > out.fq 提取名称在 file 中的name.lst序列,每行一个序列名称: seqtk subseq in.fq name.lst > out.fq 提取文件中包含的区域中的序列reg.bed: seqtk subseq in.fa reg.bed > out.fa 将reg.bed区域屏蔽为小写: ...