GATK的HaplotypeCaller是经常用到的变异检测模块,但在大基因组或高深度测序模式下运行速度比较慢,虽然有--native-pair-hmm-threads多线程参数,但对效率的提升并不明显。 GATK同时也提供了基于Spark的数据处理引擎,工具名字是HaplotypeCallerSpark ,是个beta版本的工具,在实际生产环境中使用需谨慎。 image.png 使用该工具...