seqtk subseq in.fa reg.bed > out.fa 5.sample 随机抽样 seqtk sample -s100 read1.fq 10000> sub1.fq seqtk sample -s100 read2.fq 10000>sub2.fq 参数说明: sample: 使用的 seqtk 对应的 sample 命令, 进行reads随机提取; -s100: 设定随机...
seqtk sample -s100 input.fastq.gz reads数(如:1500) 或者 需要保留的数据比例(如:0.5) 其中-s是用于指定随机种子,当为PE数据时,随机数种子要相同,确保fastq的ID对应.
将fastq转换成fasta: seqtk seq -a Sample_R1.fq.gz > Sample_R1.fa 得到反向互补序列: seqtk seq -r Sample_R1.fq.gz > Sample_Revc_R1.fq 2.sample 随机抽样 seqtk sample -s100 Sample_R1.fq.gz 10000 #可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取...
seq 主要功能都在这个选项中,也是最常用的一项 sample 用于抽样 subseq 提取序列 fqchk fastq质量评估 mergepe 合并pairend reads trimfq 很明显是截取fastq hety 计算某个区域杂合性,筛选杂合位点 gc 识别高低gc区域 mutfa 标记出高变区 mergefa 合并fastq或者fasta文件 famask 屏蔽fasta文件,比如将重复区用字母...
seqtk sample-s100 Sample_R1.fq.gz10000# 可直接对压缩文件进行序列随机提取,在提取R1和R2两个文件的时候,需要-s值一致,才能使提取的序列id号对应。 3. subseq 提取序列 代码语言:javascript 代码运行次数:0 复制 Cloud Studio代码运行 # 根据输入的bed文件信息,将固定区域的序列提取出来: ...
seqtk sample -s100 read2.fq 10000 > sub2.fq -s后面跟随机seed,对于双端测序的reads,必须使用一样的seed,不然得到的sample无法正确pair 对fq/fa文件中的reads进行开头/末尾的trim seqtk trimfq -b 5 -e 10 in.fa > out.fa # -b: 指定左侧去除的reads数目 ...
seqtk sample -s100 read2.fq 0.85 > sub2.fq 如果FASTQ为压缩文件,也可以直接提取,并且在随机提取之后使用gzip重新生成压缩文件; seqtk sample -s100 read1.fq.gz 10000 |gzip > sub1.fq.gz seqtk sample -s100 read2.fq.gz 10000 |gzip > sub2.fq.gz ...
seqtk sample-s100 read2.fq0.5>sub2.fq 这里还有一个小技巧,如果原始文件是压缩文件,也可以直接使用seqtk进行抽取,不需要先解压。不过抽出来的reads需要使用管道,进行压缩。这样才能保证抽完还是压缩文件。 代码语言:javascript 复制 seqtk sample-s100 read1.fq.gz10000|gzip>sub1.fq.gz ...
seqtk sample -s100 Sample_R1.fq.gz 10000 4.subseq 提取序列 4.1根据输入的bed文件信息,将固定区域的序列提取出来: seqtk subseq in.fa reg.bed > out.fa 4.2根据输入的name list,提取相应名称序列: seqtk subseq in.fq name.lst > out.fq
seqtk sample input.fastq 100 > output.fastq 这个命令将从输入的FASTQ文件中随机抽取100个序列,并将结果写入一个新的输出文件。 4.从FASTQ文件中随机选取一定百分比的序列: shell seqtk sample -s100 input.fastq 0.1 > output.fastq 这个命令将从输入的FASTQ文件中随机选取10的序列,并将结果写入一个新的输出文件...