zcat C1_1.fq.gz | seqkit sample -p 0.1 -o sample.fq.gz # 抽样1000条 zcat C1_1.fq.gz | seqkit sample -n 1000 -o sample.fq.gz 1. 2. 3. 4. 注意:1000条并不是很准确,可能是900多条,为什么呢?看这里了解问题。https://bioinf.shenwei.me/seqkit/note/#effect-of-random-seed-on-resu...
| seqkit sample -p 0.1 \ | seqkit head -n 1000 -o sample.fa.gz # 设置随机种子,方便重复结果: -s 11 zcat hairpin.fa.gz \ | seqkit sample -p 0.1 -s 11 |head # 抽样后打乱序列 :seqkit shuffle zcat hairpin.fa.gz \ | seqkit sample -p 0.1 \ ...
zcat C1_1.fq.gz | seqkit sample -p 0.1 -o sample.fq.gz # 抽样1000条 zcat C1_1.fq.gz | seqkit sample -n 1000 -o sample.fq.gz 注意:1000条并不是很准确,可能是900多条,为什么呢?看这里了解问题。https://bioinf.shenwei.me/seqkit/note/#effect-of-random-seed-on-results-of-seqkit-samp...
seqkit fx2tab -n -i -B A -B T duplicated-reads.fq.gz | head 用于从文件中取部分序列用于分析,可以按数量或者按比例选择。1.按照数量选择(数量不一定准确)seqkit sample -n 1000 duplicated-read.fa.gz | head 2.按照比例选择 seqkit sample -p 0.001 duplicated-reads.fq.gz 用于匹配...
-p, --proportion float sample by proportion -s, --rand-seed int rand seed for shuffle (default 11) -2, --two-pass 2-pass mode lower memory 举例:随机抽取序列 seqkit sample -n 10000 -s 11 test1_1.fq -o sample.fq seqkit sample -p 0.1 -s 11 test1_1.fq -o sample.fq ...
sample 按数量或比例对序列进行抽样。 按照百分比例和序列数量进行抽样 # 抽样百分之十 zcat C1_1.fq.gz | seqkit sample -p 0.1 -o sample.fq.gz # 抽样1000条 zcat C1_1.fq.gz | seqkit sample -n 1000 -o sample.fq.gz 注意:1000条并不是很准确,可能是900多条,为什么呢?看这里了解问题。https:...
seqkit sample -n 10000 -s 11 test1_1.fq -o sample.fq seqkit sample -p 0.1 -s 11 test1_1.fq -o sample.fq 八、排序输出命令 seqkit sort [flags] 参数: -l, --by-length 按照序列长度排序 -n, --by-name by full name -s, --by-seq ...
seqkit sample -n 10000 -s 11 test1_1.fq -o sample.fq seqkit sample -p 0.1 -s 11 test1_1.fq -o sample.fq 八、排序输出命令 seqkit sort [flags] 参数: -l, --by-length 按照序列长度排序 -n, --by-name by full name -s, --by-seq 按照序列排序 ...
1.duplicate对序列复制重复-n次 ## 取序列进行重复2次,并进行重新命名cat hairpin.fa|seqkit head-n1|seqkit duplicate-n2|seqkit rename 2.rmdup一个文件内根据id/name/seq来去除重复序列。 -s根据相同的序列来去除重复 -n根据相同的姓名去除重复 -d file.fas保存重复的序列。
zcat hairpin.fa.gz | seqkit sample -p 0.1 -o sample.fa.gz #按照比例取序列 zcat hairpin.fa.gz | seqkit sample -n 1000 -o sample.fa.gz #按照数量11. renamecat in.fa | less #和seqtk中rename的区别是前者会从1到n重新排序,后者是对后来重复的内容加_2到_n的后缀 >a comment acgt >b ...