例如GATK Funcotator注释时,对这两类VCF文件是严格区分的 (调用了完全不同的数据库,当然基因组版本是一样的,只是涉及肿瘤驱动突变的功能注释时,调用的数据库可能有所区别)。 ①VCF注释。由于VCF文件注释工具很多,如:SnpEff、ANNOVAR、GATK Funcotator、VEP、CADD等,不同软件依赖不同的运行环境和注释数据库。 注释...
它支持好几种输入格式数据: BED: a simple tab-delimited format containing 3-12 columns of data. The first 3 columns contain the coordinates of the feature. If available, the VEP will use the 4th column of the file as the identifier of the feature. GFF: a format for describing genes and ...
1 889455 . G A . . ## 假设我们的vcf文件里面记录的突变是这个,那么我们可以用snpEFF进行注释,注释得到的信息非常完全! 信息用|符号分割,所有很容易用脚本提取需要的信息 ANN=A|stop_gained|HIGH|NOC2L|ENSG00000188976|transcript|ENST00000327044|protein_coding|7/19|c.706C>T|p.Gln236*|756/2790|706/...