samtools sort:假设我们有一个bam文件,可以通过以下命令对其排序。为了省去安装等复杂步骤,这里直接使用了下载自 sixoclock软件仓库的 samtools-sort 软件,可前往 传送门免费下载,sixoclock采用了 cwl格式来表示生信流程,所以我们需要单独配置一个samtools-sort运行参数(yaml格式),如下:这里我直接使用...
sort命令格式如下: samtools sort [-llevel] [-mmaxMem] [-oout.bam] [-Oformat] [-n] [-Ttmpprefix] [-@threads] [in.sam|in.bam|in.cram] 参数: -l INT 设置输出文件压缩等级。0-9,0是不压缩,9是压缩等级最高。不设置此参数时,使用默认压缩等级; -m INT 设置每个线程运行时的内存大小,可...
samtools sort命令时,按默认染色体位置排序,顺利建立Index,如果前面排序有出入,可能不能正确建立索引。 这里我就一次建立索引了。 代码语言:javascript 复制 foriinCK-4CK-7CK-8HGJ-10HGJ-6HGJ-9;dosamtools index./cleandata/samtools_bam/${i}_sort.bam./cleandata/samtools_bam/${i}_sort.bam.bai;done 4...
samtools sort test.bam -o test.sort.bam 3、index 主要功能:对bam文件建立索引,但在此之前必须进行排序(sort),生成后缀是.bai的文件。 参数释义: -b:创建一个.bai格式的索引文件(默认) -c:创建.csi格式的索引文件 -m:创建.csi文件,索引的最小间隔值 用法: samtools index test.sort.bam 4、merge 功能...
-m 内存参数默认下500,000,000 即500M(不支持M,G等缩写) -n 设定排序方式按short reads 的ID排。默认按照fasta在文件中的顺序 例子:samtools sort accepted.bam accepted.sort.accepted.sort.bam 3、merge 将2个或者2个以上已经sort过的bam文件进行合并。
sort命令的输出默认是标准输出写入,或者使用-o参数时,指定bam文件输出名。sort命令还会在内存不足时创建临时文件tmpprefix.%d.bam Usage:samtools sort [-l level] [-m maxMem] [-o out.bam] [-O format] [-n] [-T tmpprefix] [-@ threads] [in.sam|in.bam|in.cram]...
Samtools sort支持多种参数设置,用于指定输入输出文件、排序方式、线程数、内存使用等。 3.1基本参数 -i输入文件:指定输入的SAM或BAM格式文件。例如,-i input.bam。 -o输出文件:指定输出的SAM或BAM格式文件。例如,-o output.bam。 3.2排序方式参数 -n按名称排序:以序列名称(chromosome name)为基础排序。 -t tagn...
按read name排序:samtools sort -n xxx.sort.bam -o xxx.sortname.bam 然后:samtools fixmate -m xxx.sortname.bam xxx.fixmate.bam 按position排序:samtools sort xxx.fixmate.bam -o xxx.sortposition.bam 最后:samtools markdup -r xxx.sortposition.bam xxx.markdup.bam(-r: 除去重复reads) ...
常用参数: -@ INT# 设置读取文件时要使用的额外线程数。 -O FORMAT# 设置输出格式。FORMAT可以设置为'default', 'json'或'tsv'来选择默认的,json或标签分隔值输出格式。如果不使用此选项,将选择默认格式。 3.merge和cat merge将多个已经sort了的bam文件融合成一个bam文件。融合后的文件不需要则是已经sort过了...
6其余子命令参数及用法 sort 代码语言:javascript 复制 samtools sort-@4d0.sam-o./d0_sort.bam-T#设置临时文件前缀,将临时文件写入PREFIX.nnnn.bam(排序过程中会产生好多临时文件)-@#定义命令执行所用的n个线程(排序和压缩)-o #将最终排序输出写入FILE,而非标准输出,设定排序后的输出文件名-O#将最终输出写...