简单的走一下fastqc+multiqc 看看数据质量,一般都会很不错的,这个数据也不例外。 代码语言:javascript 复制 ls*.gz|xargs~/biosoft/fastqc/FastQC/fastqc-o./-t5 但是值得注意的是本文章中的测序reads的编码格式是phred+64 而不是传统的33 然后走WES的标准SNP-calling流程 选用的是经典的GATK best practice的流程...
简单的走一下fastqc+multiqc 看看数据质量,一般都会很不错的,这个数据也不例外。 ls*.gz|xargs~/biosoft/fastqc/FastQC/fastqc-o./-t5 但是值得注意的是本文章中的测序reads的编码格式是phred+64而不是传统的33 然后走WES的标准SNP-calling流程 选用的是经典的GATK best practice的流程,代码如下: moduleload java...
了解WES数据分析步骤:2016-A Survey of Computational Tools to Analyze and Interpret Whole Exome Sequencing Data 选择部分数据如下: 随便选择了5个样本,可以在SRA数据库下载拿到这些信息(这个小技巧自行探索,或者看我B站教学视频)其ID号及描述如下, SRX445405 MALE NPC15 SRR1139956 NPC15F NO SRS540548 NPC15F-...
可以看到T的测序深度高于N,符合实验设计。T的外显子区域平均测序深度高达91X,是比较好的数据了,而且外显子旁边50bp范围区域平均测序深度还有57X,旁边100bp区域还有34X,也说明这款芯片的捕获效率比较好 然后走走somatic mutation calling流程 因为是配对数据,还可以走somatic mutation calling流程 reference=/home/jianm...