pair:从两个FASTQ文件中匹配成对的reads。 range:打印范围内的FASTQ/FASTA文本。 rename:重复ID重命名。 replace:用正则表达式替代名称或序列。 restart:重置环形基因组位置。 rmdup:删除重复序列的ID、名称或序列。 sample:按数量或比例取样。 sana:清理不完整的单行FASTQ文件。 scat:连接FASTX文件。 seq:选择、滤除...
mutate 编辑序列(点突变、插入、删除) pair 匹配双端序列文件 range 打印一个范围内的序列 rename 重命名重复序列ID replace 使用正则表达式修改名称或者序列 restart 重置环状基因组的起始位置 rmdup 通过id/名称/序列删除重复的序列 sample 按数量或比例对序列进行抽样 sana 清理损坏的单行fastq文件 scat real time r...
mutate:编辑序列(点突变、插入、删除) pair:从两个fastq文件匹配成对的reads range:打印范围内的fq/fa文本 rename:重复id重命名 replace:用正则表达式替代name/sequence restart:重置环形基因组位置 rmdup:删除重复序列的ID/name/sequence sample:按数量或比例取样 sana:清理不完整的单行fq文件 scat:对fastx进行连接 s...
留下匹配的,去除不匹配的,这里我们使用扩增子的双端序列做一个演示: 注意:双端序列在两个文件中的顺序最好是一样的,否则会消耗大量内存去匹配。 AI检测代码解析 seqkit pair -1 C1_1.fq.gz -2 C1_2.fq.gz -O result # -u 输出未匹配上的文件 seqkit pair -1 C1_1.fq.gz -2 C1_2.fq.gz -O...
seqkit pair -1 C1_1.fq.gz -2 C1_2.fq.gz -O result # -u 输出未匹配上的文件 seqkit pair -1 C1_1.fq.gz -2 C1_2.fq.gz -O result -u -f sample 按数量或比例对序列进行抽样。 按照百分比例和序列数量进行抽样 # 抽样百分之十 zcat C1_1.fq.gz | seqkit sample -p 0.1 -o sample....
print sequences of the first genome with common prefixes in name pair match up paired-end...
pair match up paired-end reads from two fastq files range print FASTA/Q records in a range (start:end) rmdup remove duplicated sequences by ID/name/sequence sample sample sequences by number or proportion split split sequences into files by id/seq region/size/parts (mainly for FASTA) ...
seqkit pair: remove the restriction of requiring FASTQ format, i.e., FASTA files are also supported.seqkit seq: update help messages. #387 seqkit fxtab: faster alphabet computation (-a/--alphabet) with a new data structure. Thanks to @elliotwutingfeng #388...
seqkit pair -1 C1_1.fq.gz -2 C1_2.fq.gz -O result -u -f sample 按数量或比例对序列进行抽样。 按照百分比例和序列数量进行抽样 # 抽样百分之十 zcat C1_1.fq.gz | seqkit sample -p 0.1 -o sample.fq.gz # 抽样1000条 zcat C1_1.fq.gz | seqkit sample -n 1000 -o sample.fq.gz ...
seqkit pair(decompressed) Vanilla: Memory:14,623,444 KB time:0:55.89 fastq_pair(decompressed) Vanilla: Memory:1,805,020 KB time:2:52.41 fastq_pair(decompressed; hashtable size=50021) Vanilla: Memory:1,804,420 KB time:5:14.04 fastq_pair(decompressed; hashtable size=10000000) ...