sambamba slice input.bam chr1H:10000-20000 > output.bam markdup — 去重 sambamba markdup OPTIONS sambamba markdup -t 4 --tmpdir=./tmp/ ./test.bam ./test.markdup.bam 2>>log/sambamba_markdup_log.txt -t:线程数 -r:表示删除重复,默认仅标记不删除 --tmpdir=TMPDIR:指定临时文件的目录 --ove...
sambamba slice input.bam chr1H:10000-20000 > output.bam markdup — 去重 sambamba markdup OPTIONS sambamba markdup -t 4 --tmpdir=./tmp/ ./test.bam ./test.markdup.bam 2>>log/sambamba_markdup_log.txt -t:线程数 -r:表示删除重复,默认仅标记不删除 --tmpdir=TMPDIR:指定临时文件的目录 --ove...
markdup — 标记去重 识别并标记(默认)或移除在测序数据中出现的重复reads。重复reads通常是测序或样本准备过程中的 PCR 扩增产生的,它们可能会影响后续变异检测和其他生物信息学分析的准确性。在判断一个读取是否为重复时,采用的是与 Picard 工具相同的标准。这些标准通常包括比对的起始位置、方向和库ID等因素。如果两...
bam 其中,markdup命令用于去重,-t参数用于指定线程数,input.bam是要去重的BAM文件,output.bam是去重后的输出文件名。此外,sambamba 还支持过滤、统计、索引等多种操作。用户可以根据自己的需求选择相应的命令进行处理。因为 sambamba 是一个开源的工具,所以用户可以随时查看其官方文档以获取更多信息和使用方法。
目前认为,samtools rmdup已经过时了,应该使用samtools markdup代替。samtools markdup与picard MarkDuplicates采用类似的策略。 (2) Picard 该工具的MarkDuplicates方法也可以识别duplicates。但是与samtools rmdup不同的是,该工具仅仅是对duplicates做一个标记,只在需要的时候对reads进行去重。
二、sambamba markdup的使用 一行命令即可: sambamba markdup--overflow-list-size600000--tmpdir='./'-r raw.bam rmdup.bam 补充: sambamba的安装方法如下: 比对结果去重软件:sambamba的安装以及安装出错解决办法 - 简书 (jianshu.com) ---
·目前认为,samtools rmdup已经过时了,应该使用samtools markdup代替。samtools markdup与picard MarkDuplicates采用类似的策略。 (2) Picard ·该工具的MarkDuplicates方法也可以识别duplicates。但是与samtools rmdup不同的是,该工具仅仅是对duplicates做一个标记,只在需要的时候对reads进行去重。