其中147表示read2的FLAG,147=128+16+2+1128表示:the read is the second read in a pair16表示:strand of the query (1 for reverse)表示查询序列是反的, 1. AI检测代码解析 原来产生的序列为: 1. AI检测代码解析 TCAAAGGGAATAGAATCGAATGAAATAGAATCTAATGGAATGGAATGGAATGGAATGGAATGGAATGGAA 1. 匹配后...
如果FLAG不在上表第一列,可以使用如下两个网站查询: 网站1:http://https://broadinstitute.github.io/picard/explain-flags.html 例如,FLAG 88=8(0x8对应值)+16(0x10对应值)+64(0x40对应值),该FLAG值意义为三个意义的汇总。 网站2:samformat.info/sam-form 另外一些常用FLAG One of the reads is unma...
2. column2 第二列是FLAG, 事先定义了以下几种flag, 每个flag用一个数字表示,对应一种比对的情况 1代表这个序列采用的是PE双端测序 2代表这个序列和参考序列完全匹配,没有插入缺失 4代表这个序列没有mapping到参考序列上 8代表这个序列的另一端序列没有比对到参考序列上,比如这条序列是R1,它对应的R2端序列没...
1.QNAME:reads名称。 2.FLAG:reads比对情况。不同的情况对应不同的值,这里的数字是所有情况的和。 3.RNAME:比对至参考序列的名称。 4.POS:比对到的位置。 5.MAPQ:比对质量。 6.CIGAR:比对情况信息。 7.RNEXT:与之配对的另一条reads所在的参考序列名称。"="表示位于同一个参考序列上,"*"表示没有另一条...
(2)第二列:FLAG 二进制标志位,表示读取序列的比对状态和其他信息。可使用第三方网站输入数值查询具体含义。 Fig.3 FLAG质量值含义 (3)第三列:RNAME 染色体名称。如果这列是“ * ”,可以认为这条read没有比对上的序列,则这一行的第四,五,八,九 列是“0”,第六,七列与该列是相同的表示方法。
利用samtools flagstat工具可以查看bam文件中比对的flag信息,并输出比对的统计结果。 AI检测代码解析 samtools flagstat *.bam 1. flag一共有12个标签,使用16进制数表示,每个标签值是2^(n-1),其中n>=12(这个没看懂),每个值有其对应的唯一解释含义,具体见下图。
0x4位是识别read是否未比对(unmapped)的唯一可信的地方。如果0x4置1,RNAME, POS, CIGAR, MAPQ, 以及FLAG的0x2, 0x100, 0x800位都不应该有值; 0x10位标明序列(SEQ字段)是否被反向互补处理过以及碱基质量值(QUAL字段)是否被反向处理过。如果0x4位没有被置1,表明链map到了链上(this corresponds to the stra...
QNAME(查询模板名称):标识查询序列的唯一标识。FLAG:标志位,揭示了比对的特性,如正向或反向、是否存在剪接等。RNAME(参考序列名称):比对所针对的基因组区域。POS(1-based起始位置):比对在参考序列上的位置,起始位置从1开始计数。MAPQ(映射质量):比对的可信度指标,反映其可靠性。CIGAR(...
(因为每插入一个字符,都需要更新5e4次父节点,这时上面的flag优化没什么卵用。。) View Code 思路2:SAM离线+并查集优化 将操作全部插入到SAM并存储之后,先进行拓扑排序; 1.为什么要进行拓扑排序? 因为拓扑的目的是为了使得SAM分层,即之后可以使用后缀数组基数排序的思想得到每个节点状态的|Right|即包含的子节点个数...