sambamba markdup -t 4 --tmpdir ~/test d0.bam ~/test/d0_mkdup.bam ##其余参数 -r: #移除重复的reads,而不仅仅是标记它们。【直接从数据中清除被识别为重复的reads】 -t: #设定使用的线程数量 -l: #指定结果文件的压缩级别,范围从 0(无压缩)到 9(最大压缩) -p: #在标准错误输出 (STDERR) 中...
flagstat: 统计BAM文件中的reads的标志位,可以显示QC通过和失败的reads数目,以及各种配对情况和重复情况。 markdup: 标记或者移除BAM文件中的重复reads,可以设置临时文件目录和压缩级别。 slice: 提取BAM文件中的某个区域,可以指定输出格式和过滤条件。 subsample:对BAM文件进行子采样。子采样是指从原始数据中随机选择一...
flagstat: 统计 BAM 文件中的 reads 的标志位,可以显示 QC 通过和失败的 reads 数目,以及各种配对情况和重复情况。 markdup: 标记或者移除 BAM 文件中的重复 reads,可以设置临时文件目录和压缩级别,使用 Picard 算法。 slice: 提取 BAM 文件中的某个区域,可以指定输出格式和过滤条件。 subsample: 对 BAM 文件进行...
flagstat: 统计 BAM 文件中的 reads 的标志位,可以显示 QC 通过和失败的 reads 数目,以及各种配对情况和重复情况。 markdup: 标记或者移除 BAM 文件中的重复 reads,可以设置临时文件目录和压缩级别,使用 Picard 算法。 slice: 提取 BAM 文件中的某个区域,可以指定输出格式和过滤条件。 subsample: 对 BAM 文件进行...
For Markdup almost 6x faster and for view 4x faster. For sort sambamba has been beaten, though sambamba is notably up to 2x faster than samtools on large RAM machines (120GB+). In addition sambamba has a few interesting features to offer, in particular fast large machine sort, see ...
sambamba markdup-r test.bam dedup.bam -r 表示删除重复,默认仅标记不删除。这样就会生成一个新的BAM文件,去除了所有被标记为重复的reads。你也可以选择保留重复序列,但是给它们添加一个标签,以便于后续分析。 总之,sambamba是一个功能强大、性能优异、易于使用的BAM文件处理工具,它可以让你的生物信息学分析更加高效...