本发明的实施方式提供了一种基于Spark SQL的RefGene基因库的注释方法.该方法包括:生成以染色体正链和负链为区分的区间森林;使用Spark系统的广播机制,广播已经生成区间森林;使用待注释变异的指定字段,查询区间森林;对返回的查询结果与待注释的表执行内连接操作;输出包含注释结果的表.在执行本流程一遍之后,如果返回的注释...