查看mapped reads的深度,在全基因组范围是否保持相当。如果有极端高/低的深度,则怀疑组装错误,或者映射了错误的reads,反映了错误或者特定特征的mapped reads。 重复序列 如果基因组上存在重复序列,组装时只得到其中一个拷贝,则在这个拷贝处的mapped reads深度会是附近序列的两倍(三个拷贝就三倍)。 重复序列一般只分析...
在测序是随机分布的情况下,期望在基因组的所有染色体上,mapped reads的depth是均匀分布的。 把reads回mapping到组装好的基因组,通过计算depth,观察depth在基因组上的分布来判断组装的质量。 3. 统计深度(depth) 3.1. samtools统计 samtools的depth调用mpileup模块进行mapped reads的深度统计。 3.1.1. samtools depth统计...
#提取比对到参考序列上的比对结果 samtools view -bF 4 sample.bam > sample_mapped.bam #提取paired reads中两条reads都比对到参考序列上的比对结果,只需要把两个4+8的值12作为过滤参数即可; samtools view -bF 12 sample.bam > sample_all.mapped.bam #提取没有比对到参考序列上的比对结果 samtools view -...
因为现在还没有明确的筛选标准,我个人理解为筛选后所得应该全部为unique mapped reads。但有些时候,在很高的筛选值也出现不unique mapped reads怎么办?这时候要分情况,如果是single-end的ChIP-seq或者RNA-seq,我们可以不理彩,如果是paired-end,对于SNP,INDEL的研究,最好还是去除,可以查看比例,如果比例低于1%,可以直...
意思是:总结映射读取
基因组映射读取
1.查看 其中bam文件中用标签4代表read未比对上;所以查看未比对上的reads用 samtools view -f 4 *bam|less -S 2.提取 提取未比对到参考序列的结果: samtools view -b -h -f 4 *.bam > unmapped.bam -h 文件包含header line;-f,提取;-b,输出为bam格式 ...
unique mapped reads 就是指唯一比对的reads 现在人们已经开始避免使用unique mapped reads这个概念了,而转向使用mapq值来保留高质量的比对结果。因为mapq值反应了一组比对结果发生的可能性,MapQ = -10 log10(P), 比如结果为10,那就是1/10的概率会出现这个比对结果,如果我们认为0.05%是一个小概率的话,那个mapq值...
Represents mapped readsSteffen Durinck
this score could be greater than AS:i.方法:grep “AS:” aligned.sam | grep –v“XS:” >unique_alignments.sam #AS:Align≥1 time XS:出现第二个最佳比对的地方 2、tophat2/hasit2 "One possible solution is to use the next best alignment score (ZS:i:, previously XS:i:)...