最近准备为sliverworkspace图形化生信平台开发报告设计器,需要一个较为复杂的pipeline作为测试数据,就想起来把之前的 [[满分室间质评之GATK Somatic SNV+Indel+CNV+SV(下)性能优化]]翻出来用一下。跑了一遍发现还是各种问题,于是想把pipeline改造成免部署、首次运行初始化环境的版本,以便需要时候能够直接运行起来,于是...
GATK,正确发音为“Gee-ay-tee-kay”(/dʒi•eɪ•ti•keɪ/),而不是“Gat-kay”(/ɡæt•keɪ/),代表基因组分析工具包,是一组用于分析高通量测序数据的命令行工具的集合,主要集中在变体 (或称为变异)发现上。 这些工具可以单独使用,也可以链接、整合在一起形成完整的工作流 (Pipeline)。...
从4.0版本开始,GATK包含了一个Picard工具包 (https://gatk.broadinstitute.org/hc/en-us/articles/360035894751)的副本,所以所有的Picard工具都可以从GATK本身内获得,其文档可在GATK网站的工具索引(Tool Index:https://gatk.broadinstitute.org/hc/en-us/categories/360002369672)中找到。 内容 1. 预览管道(Pipeline,...
最近准备为sliverworkspace 图形化生信平台开发报告设计器,需要一个较为复杂的pipeline作为测试数据,就想起来把之前的 [[满分室间质评之GATK Somatic SNV+Indel+CNV+SV(下)性能优化]]翻出来用一下。跑了一遍发现还是各种问题,于是想把pipeline改造成免部署、首次运行初始化环境的版本,以便需要时候能够直接运行起来,于是...
1.预览管道(Pipeline,即打包的数据分析流程)2.快速入门3.系统及环境4.获得GATK5.安装6.测试否工作7.运行GATK和Picard命令8.学习最佳实践9.管道运行10.得到帮助11.订阅论坛通知1.预览管道如果你还不确定是否真的需要在工作中使用GATK,那么应该考虑在不做任何实际工作的情况下先简单测试软件的使用。要做到这一点,可...
Git address:https://gitee.com/joy_lee/gatk-pipeline Tag: v0.34 Main path:Hello-GATK.wdl 附源码: GATK-HaplotypeCaller.wdl 运行GATK工作流 选择数据:sample,仍然选择实体样本NA12878和my_sample_data,这部分我们将使用第一部分中所输出的bam文件作为这一部分的输入。
开箱即用版本 满分室间质评之GATK Somatic SNV+Indel+CNV+SV(2024-04-30更新) 生物基因 测试数据来自2017年卫计委室间质评提供的bed文件(pipeline会自动下载)和测试数据,修改命名以匹配pipeline输入端,也可以替换为自己的数据文件,因为室间质评目前参考基因组还停留在hg19版本,所以本流程仍然使用hg19(GRCH37),如果...
GATK初创于为人类遗传学分析服务,现在其数据处理范围已扩大至包括体细胞短变异检测(somaticshort variant calling),拷贝数变异(copy number variant,CNV)和结构变异(structural variant,SV)分析等。 此外,GATK还包括许多实用程序,如高通量测序数据(外显子组,全基因组等)的处理和质量控制,以及Picard工具包。GATK基于工业...
cutoff.cnv_max 0.5 数值 cutoff.vaf 0.01 数值 envis.scatter 8 数值 惯例:优化后分析流程(pipeline): 下面看看优化过程 INPUT 输入文件(无变化) Normal:Map & Order & MarkDuplicate 合并完成 代码语言:javascript 复制 #bwa map完成接管道操作sambamba转换为bam,然后管道操作sambamba排序 ${tools.bwa} mem \...
以上五套pipeline 可以根据研究对象是DNA还是RNA进行划分:DNA 测序(包含1,2,4,5)和RNA 测序(3)。可以看到,GATK 更多的是倾向于DNA 测序数据的分析。对于DNA测序而言,主要识别SNP和CNV 两大类型的变异,每种变异类型又有Germline和Somatic的区别。