这可能会导致数据不准确,影响实验结果。此外,处理具有高错误率的测序数据会消耗更多的时间和资源,导致需要重新测序,浪费实验宝贵的资源。因此,分析每个碱基的质量是确保测序数据可靠性的重要步骤。 最后,如何对“per base sequence quality”进行分析呢?测序数据的质量评估可以使用多种工具,包括FastQC和Trimmomatic等。
Fastqc结果: Per base sequence quality 横轴为read长度,纵轴为质量得分,Q = -10*log10(error P)。 柱状表示该位置所有序列的测序质量的统计,柱状是25%~75%区间质量分布,error bar是10%~90%区间质量分布,蓝线表示平均数。一般要求所有位置的10%分位数大于20,即大于最多允许该位置10%的序列低于Q20。当任何...
看GC分布图没问题,前面几个碱基抖动正常的;