1、sort sort对bam文件进行排序。 Usage: samtools sort [-n] [-m ] -m 参数默认下是 500,000,000 即500M(不支持K,M,G等缩写)。对于处理大数据时,如果内存够用,则设置大点的值,以节约时间。 -n 设定排序方式按short reads的ID排序。
samtools sort[-l level][-m maxMem][-o out.bam][-Oformat][-n][-Ttmpprefix][-@ threads][in.sam|in.bam|in.cram] 重要参数: 代码语言:javascript 复制 -lINT设置输出文件压缩等级。0-9,0是不压缩,9是压缩等级最高。不设置此参数时,使用默认压缩等级;-mINT设置每个线程运行时的内存大小,可以使用K...
samtools sort -l 9 -m 90M -n -o test.sort.bam -T sorted -@ 2 test.bam 上述含义是:压缩最高级9、每一个线程内存90Mb、输出文件名test.sort.bam、临时文件前缀sorted、线程数2。 当然,最简单命令: samtools sort test.bam -o test.sort.bam 3、index 主要功能:对bam文件建立索引,但在此之前必须...
samtools sort:假设我们有一个bam文件,可以通过以下命令对其排序。为了省去安装等复杂步骤,这里直接使用了下载自 sixoclock软件仓库的 samtools-sort 软件,可前往 传送门免费下载,sixoclock采用了 cwl格式来表示生信流程,所以我们需要单独配置一个samtools-sort运行参数(yaml格式),如下:这里我直接使用...
samtools sort [-llevel] [-mmaxMem] [-oout.bam] [-Oformat] [-n] [-Ttmpprefix] [-@threads] [in.sam|in.bam|in.cram] 参数: -l INT 设置输出文件压缩等级。0-9,0是不压缩,9是压缩等级最高。不设置此参数时,使用默认压缩等级;
samtools sort-@4d0.sam-o./d0_sort.bam-T#设置临时文件前缀,将临时文件写入PREFIX.nnnn.bam(排序过程中会产生好多临时文件)-@#定义命令执行所用的n个线程(排序和压缩)-o #将最终排序输出写入FILE,而非标准输出,设定排序后的输出文件名-O#将最终输出写为sam、bam或cram格式(文件名后缀也可以自动识别)-m #...
使用Samtools sort设置线程数为8,最大内存为4GB对一个BAM文件进行排序: samtools sort -@ 8 -m 4G -i input.bam -o output.bam 4.4根据标签排序 使用Samtools sort按照“Read group”和“Sample name”排序: samtools sort -t RG,SM -iinput.bam -o output.bam 4.5过滤未配对reads 使用Samtools sort过滤掉...
-m 内存参数默认下500,000,000 即500M(不支持M,G等缩写) -n 设定排序方式按short reads 的ID排。默认按照fasta在文件中的顺序 例子:samtools sort accepted.bam accepted.sort.accepted.sort.bam 3、merge 将2个或者2个以上已经sort过的bam文件进行合并。
-m [INT]:设定内存使用量(默认值为500000000) 4. merge 作用 将多个排序后的序列文件合并为一个文件 格式 $ samtools merge [options] <输出bam文件> <输入bam文件1> <输入bam文件2>… 主要参数 -n:指定输入文件是以reads名称排序的(与sort中的-n参数配合使用) ...