seqkit split [flags] 参数: -i, --by-id split squences according to sequence ID -p, --by-part int 将一个文件分割成N 份 -s, --by-size int 将一个文件按照N 条序列一个文件进行分割 -O, --out-dir string output directory (default value is infile.split) -2, --two-pass two-pass m...
seq 转换序列(反向,补充,提取ID…) shuffle 随机序列 sliding 序列滑窗提取,支持环形基因组 sort 按id/名称/序列/长度排序序列 split 按id/seq区域/大小/部件将序列拆分为文件(主要用于FASTA) split2 按序列数量/文件数将序列拆分为多个文件(FASTA, PE/SE FASTQ) stats FASTA/Q文件的简单统计 subseq 通过region...
seqkit split[flags]参数:-i,--by-id split squences according to sequence ID-p,--by-partint将一个文件分割成N 份-s,--by-sizeint将一个文件按照N 条序列一个文件进行分割-O,--out-dirstringoutput directory(defaultvalueisinfile.split)-2,--two-pass two-pass mode to lower memoryusage(only FAST...
-s, --seq 只打印序列 --id-regexp string 对于解析ID的正则表达式,(default "^(\\S+)\\s?") seqkit split 的使用 usage:seqkit split [flags] -i, --by-id 根据序列ID切割序列 -p, --by-part int 将一份文件分割成N份 -s, --by-size int 将一个文件按照N条序列进行分割 -O, --out-dir...
seqkit split [flags] 参数: -i, --by-id split squences according to sequence ID -p, --by-part int 将一个文件分割成N 份 -s, --by-size int 将一个文件按照N 条序列一个文件进行分割 -O, --out-dir string output directory (default value is infile.split) ...
split2-将一个序列文件按照大小或分割成多少部分进行分割5)编辑replace-通过正则表达式修改名字或序列rename-重新命名重复的IDrestart-为环状基因组重新设置起始位置concat-将多个文件中含有相同的ID的序列连接成一条序列mutate-编辑序列(点突,插入,删除)6)排序sort-按照id/name/sequence进行排序2、具体用法。添加环境...
seqkit split [flags] 参数: -i, --by-id split squences according to sequence ID -p, --by-part int 将一个文件分割成N 份 -s, --by-size int 将一个文件按照N 条序列一个文件进行分割 -O, --out-dir string output directory (default value is infile.split) ...
$ seqkit common file*.fa -o common.fasta #通过ID寻找共同序列 $ seqkit common file*.fa -n -o common.fasta #通过全名 $ seqkit common file*.fa -s -i -o common.fasta #通过序列 split $ seqkit split hairpin.fa.gz -s 10000 #按序列数分割文件 [INFO] split into 10000 seqs per file [...
splitSplit sequences into files by id/seq region/size/parts (mainly for FASTA)FASTA preffered split2Split sequences into files by size/parts (FASTA, PE/SE FASTQ)FASTA/Q headPrint first N FASTA/Q recordsFASTA/Q head-genomePrint sequences of the first genome with common prefixes in nameFAST...
seqkit: fix bug of parsing sequence ID delimited by tab (\t). #78 seqkit grep: better logic of --delete-matched. seqkit common/rmdup/split: use xxhash to replace MD5 when comparing with sequence, discard flag -m/--md5. seqkit stats: new flag -b/--basename for outputting basename inste...