1.bam文件各列的意义 主体部分有11个主列和1个可选列1.QNAME 比对的序列名称 例如:M04650:84:000000000-B837R:1:1101:22699:1759(一条测序reads的名称)2.FLAG Bwise FLAG(表明比对类型:paring,strand,mate …
近期需要提取 unmapped bam,使用以下命令就可以提取: samtools view -b -h -F 2 -@ 16 *.bam >*.bam #2表示paired reads中每一个都匹配上了,我认为除去这些,其他的都算 unmapped 常见Flag汇总:#TODO:分类、解释 65 69 73 77 81 83 97 99 113 117 121 129 133 137 141 145 147 161 163 177 181...
那其他数字的含义呢,他们只是简单数字组合而已,例如:1040是1024 + 16,Read比对到反义链且是一个PCR重复,简单的数字相加而已。 也可以借助flag解释链接来解析上述数字的含义,如把1040输入到该网站会返回: “read reverse strand”和“read is PCR or optical duplicate”。 不过,SAM说明文档中FLAG的代号均使用按位...
# 查看bam文件,每一行代表一条记录 图中有两条记录,其中第二列即为flag值。 这个值是由多个“基本的”flag值相加得来的,不同的“基本”flag值代表比对的不同性质。 基本flag的赋值为2的n次方,即1,2,4,8...等等等,其它任意数值的flag值都可以由不同且唯一的基本flag值组合得到。如99只能由1+2+32+64得...
FLAG(十进制)二进制位置含义 0 000000000000 该read是single reades(单端) 1 000000000001 该read是成对的paired reads(双端)中的一个 2 000000000010 paired reads中每个都正确比对到参考序列上 4 000000000100 该read没比对到参考序列 8 000000001000 与该read成对的matepair read没有比对到参考序列上 16 000000010...
记录于BAM文件的第2列,以 bwa 软件比对结果为例 可以使用samtools查询: samtools view test.bam | cut -f2 | uniq 问题来了,这些数字的意义是什么呢? 首先可以参考SAM/BAM文件的解释文档: http://samtools.sourceforge.net/SAMv1.pdf 其中,对于FLAG有如下说明: FLAG: bitwise...
sam或者bam文件flag数值对应解释 标签: Premiere 收藏 1: 代表这个序列采用的是PE双端测序 2: 代表这个序列和参考序列完全匹配,没有插入缺失 4: 代表这个序列没有mapping到参考序列上 8: 代表这个序列的另一端序列没有比对到参考序列上,比如这条序列是R1,它对应的R2端序列没有比对到参考序列上 16:代表这个序列...
第2列:FLAG(如果某一个数值不是下面的任意值,那么那个数值就是下面这些数里面几个的和)。另外,如果flag值是0,那么说明测序为单端测序且这条read是primary line,一般是该read的最佳比对。 1:该read是成对的paired reads中的一个 2:paired reads中每个都正确比对到参考序列上 ...
将下面的代码保存在记事本里面,另存为一个html文件,如文件名:FlagExplain.html(拓展名一定要为.html)。双击既可以在浏览器里面打开了。 01 02Explain SAM Flags 03 04lstFlags = [["read paired", 0x1], 05["read mapped in proper pair", 0x2], 06["...
第二列是FLAG, 事先定义了以下几种flag, 每个flag用一个数字表示,对应一种比对的情况 1代表这个序列采用的是PE双端测序 2代表这个序列和参考序列完全匹配,没有插入缺失 4代表这个序列没有mapping到参考序列上 ...