flagstat: 统计BAM文件中的reads的标志位,可以显示QC通过和失败的reads数目,以及各种配对情况和重复情况。 markdup: 标记或者移除BAM文件中的重复reads,可以设置临时文件目录和压缩级别。 slice: 提取BAM文件中的某个区域,可以指定输出格式和过滤条件。 subsample:对BAM文件进行子采样。子采样是指从原始数据中随机选择一...
sambamba markdup -t 4 --tmpdir ~/test d0.bam ~/test/d0_mkdup.bam ##其余参数 -r: #移除重复的reads,而不仅仅是标记它们。【直接从数据中清除被识别为重复的reads】 -t: #设定使用的线程数量 -l: #指定结果文件的压缩级别,范围从 0(无压缩)到 9(最大压缩) -p: #在标准错误输出 (STDERR) 中...
bam 其中,markdup命令用于去重,-t参数用于指定线程数,input.bam是要去重的BAM文件,output.bam是去重后的输出文件名。此外,sambamba 还支持过滤、统计、索引等多种操作。用户可以根据自己的需求选择相应的命令进行处理。因为 sambamba 是一个开源的工具,所以用户可以随时查看其官方文档以获取更多信息和使用方法。
参数 Usage:sambamba[command][args...]Available commands:view view contents and convert from one format to another(SAM/BAM/JSON/UNPACK)index build index(BAI)merge merge files(BAM)sort sort file(BAM)slice slice file(BAM using BED)markdup mark or remove duplicates(BAM)subsample subsample(BAM)flags...
目前认为,samtools rmdup已经过时了,应该使用samtools markdup代替。samtools markdup与picard MarkDuplicates采用类似的策略。 (2) Picard 该工具的MarkDuplicates方法也可以识别duplicates。但是与samtools rmdup不同的是,该工具仅仅是对duplicates做一个标记,只在需要的时候对reads进行去重。
sambamba markdup-r test.bam dedup.bam -r 表示删除重复,默认仅标记不删除。这样就会生成一个新的BAM文件,去除了所有被标记为重复的reads。你也可以选择保留重复序列,但是给它们添加一个标签,以便于后续分析。 总之,sambamba是一个功能强大、性能优异、易于使用的BAM文件处理工具,它可以让你的生物信息学分析更加高效...
sambamba markdup -t 11 --tmpdir test.bam test_mkdup.bam ##其余参数 -r: #移除重复的reads,而不仅仅是标记它们。【直接从数据中清除被识别为重复的reads】 -t: #设定使用的线程数量 -l: #指定结果文件的压缩级别,范围从 0(无压缩)到 9(最大压缩) ...