首先尝试使用单个样本进行尝试 gatk VariantFiltration \ -V P174635_LN_filter.snp.vcf \ --filter-expression "CONTQ < 50 || DP < 500 || GERMQ < 30 " \ --filter-name "yuqiao" \ -G-filter "AF < 0.1" \ -G-filter-name "low_AF" \ -O P174635_LN_filter.snp.filter.vcf 注意:每个...
首先是硬过滤的例子,这个过程我都用最新的GATK来完成。GATK 4.0中有一个专门的VariantFiltration模块(继承自GATK 3.x),它可以很方便地帮我们完成这个事情。不过,过滤的时候,需要分SNP和Indel这两个不同的变异类型来进行,它们有些阈值是不同的,需要区别对待。在下面的例子里,我们还是用上一篇文章中最后得到的变异数...
gatk VariantFiltration -V ${sampleName}_INDEL.vcf.gz --filter-expression "QD < 2.0 || FS > 200.0 || SOR > 10.0 || MQRankSum < -12.5 || ReadPosRankSum < -8.0" --filter-name "Filter" -O ${sampleName}_INDEL.filter.vcf.gzgatk SelectVariants -V ${sampleName}_INDEL.filter.vcf....
contamination:02-(3)步骤运行haplochecker得到的MinorLevel值 (7)过滤变异 - 过滤掉位于blacklisted_site的mtDNA变异(VariantFiltration) gatk--java-options"-Xmx10G -Djava.io.tmpdir=${tmpDir}"VariantFiltration \ -V${sampleName}_final_filtered.vcf \-O...
26.457INFO VariantFiltration-Executingasjychu@localhost.localdomain on Linux v3.10.0-1062.el7.x86_64 amd6410:32:26.457INFO VariantFiltration-Java runtime:OpenJDK64-Bit Server VM v1.8.0_152-release-1056-b1210:32:26.457INFO VariantFiltration-Start Date/Time:April12,202110:32:26AM CST10:32:26.457...
命令行: /share/work/biosoft/java/latest/bin/java -XX:ParallelGCThreads=5 -Xmx50g -Djava.io.tmpdir=tmp -jar /share/work/biosoft/GATK/3.6/GenomeAnalysisTK.jar -T VariantFiltration ……… 报错: ### ERROR --- ### ERROR A USER ERROR has occurred (version 3.6-0-g89b7209): ### ERROR #...
#提取InDel文件gatk--java-options"-Xmx10g -Djava.io.tmpdir=./tmp"\SelectVariants-R./genome.fasta\#参考基因组-Vall.merge_raw.vcf\#合并后的VCF文件--select-typeINDEL\#筛选提取类型-Oall.raw.indel.vcf#输出文件#过滤InDelgatk--java-options"-Xmx10g -Djava.io.tmpdir=./tmp"\VariantFiltration-R./...
相比于VQSR,采用hard-filter对raw vcf文件相对简单许多,主要采用QD, FS以及ReadPosRankSum参数对突变位点进行过滤,当且仅当QD<2,FS>200, ReadPosRankSum< -20时,该突变位点被保留。 $gatkVariantFiltration\-R~/gatk_files/human_g1k_v37.fasta \-Vhg020304_INDEL.vcf.gz \-Ooutput_INDEL...
这一步的目的就是对上一步call出来的变异位点进行过滤,去掉不可信的位点。这一步可以有两种方法,一种是通过GATK的VariantFiltration,另一种是通过GATK的VQSR(变异位点质量值重新校正)进行过滤。 通过GATK网站上提供的最佳方案可以看出,GATK是推荐使用VASR的,但使用VQSR数据量一定要达到要求,数据量太小无法使用高斯模型...
这一步可以有两种方法,一种是通过GATK的VariantFiltration,另一种是通过GATK的VQSR(变异位点质量值重新校正)进行过滤。 通过GATK网站上提供的最佳方案可以看出,GATK是推荐使用VASR的,但使用VQSR数据量一定要达到要求,数据量太小无法使用高斯模型。还有,在使用VAQR时,indel和snp要分别进行。 VQSR原理介绍: 这个模型是...