seqkit watch -p 500000 -O qhist.pdf -f MeanQual C1_1.fq.gz 从有错误记录的fastq文件中挽救可用的读取 sana:清理损坏fastq文件 这里我专门将C1_1.fq的第一个序列进行了错位,进行测试。这个操作往往在进行数据整合的时候可以有很大作用。 zcat C1_1.fq.gz|sed '2 s/^/A/' > C1_1_bad.fq ...
seqkit watch -L -f ReadLen hairpin.fa # 每五千个做一个图保存在pdf文件中 seqkit watch -p 500000 -O qhist.pdf -f MeanQual C1_1.fq.gz 1. 2. 3. 4. 5. 从有错误记录的fastq文件中挽救可用的读取 sana:清理损坏fastq文件 这里我专门将C1_1.fq的第一个序列进行了错位,进行测试。这个操作往往...
watch:实时监控序列文件的数据
version 打印版本信息并检查是否更新 watch 序列特征的监测和在线直方图 以下介绍一些常用的命令 一、序列操作: 1.取反向序列 seqkit seq test.fa -r > test_re.fa 2.取互补序列 seqkit seq test.fa -p > test_com.fa 3.取反向互补序列 seqkit seq test.fa -r -p > test_re_com.fa 4.DNA序列转换为...
与“watch”类似,“bam”子命令为BAM序列比对数据提供实时监控,其指标包括比对质量、比对准确性、比对的长度等等。我们希望“seqkit bam”能与其它现有的BAM处理工具(如Samtools)互补。此外,“scat”子命令用于对指定文件夹中实时增加的FASTA/Q数据进行读取和输出,方便下游分析工具进行进一步处理。
split2:按size/parts序列拆分为文件 stats:fq/fa简单统计 subseq:按照region/gtf/bed获取子序列 sum:计算fq/fa文件中所有序列的消息摘要 tab2fx:将表格格式转换为fq/fa translate:将DNA/RNA翻译成蛋白质序列 version:版本 watch:实时监控序列文件的数据
这个工具,真心非常强大。日常工作中关于fastq和fasta处理的需求,基本都可以用这个工具来完成。 文档:https://bioinf.shenwei.me/seqkit/usage/ 基本功能: Basic: seq, stats, subseq, sliding, faidx, watch, sana, scat Format conversion: fq2fa, fx2tab, tab2fx, convert, translate ...
## 序列和子序列 **seq** 转换序列(序列颠倒,序列互补,提取ID) **subseq** 从区域/gtf/bed中获得序列,包括侧面的序列 **sliding** 滑动序列,支持环式基因组 **stats** 对FASTA/Q files进行简单统计 **faidx** 创造fasta索引文件并提取子序列 **watch** 检测并连线序列特点的柱状图 **sana** 清除质量...
与“watch”类似,“bam”子命令为BAM序列比对数据提供实时监控,其指标包括比对质量、比对准确性、比对的长度等等。我们希望“seqkit bam”能与其它现有的BAM处理工具(如Samtools)互补。此外,“scat”子命令用于对指定文件夹中实时增加的FASTA/Q数据进行读取和输出,方便下游分析工具进行进一步处理。
watch 序列特征的监测和在线直方图 参数 Flags: --alphabet-guess-seq-length int seqkit根据第一个FASTA记录猜测序列类型的序列前缀的长度(0表示整个序列)(默认10000) -h, --help 显示帮助 --id-ncbi FASTA头是ncbi风格的,例如>gi|110645304|ref|NC_002516.2 ...