gatk VariantFiltration -V ${sampleName}_INDEL.vcf.gz --filter-expression "QD < 2.0 || FS > 200.0 || SOR > 10.0 || MQRankSum < -12.5 || ReadPosRankSum < -8.0" --filter-name "Filter" -O ${sampleName}_INDEL.filter.vcf.gzgatk SelectVariants -V ${sampleName}_INDEL.filter.vcf....
4. 变异过滤 # QD: 深度的质量分数, 变异位点的质量分数除以测序深度# QD < 2.0表示低质量的变异# MQ: 比对质量值, 衡量reads比对到参考基因组的准确性# MQ < 40.0表示比对质量较差# FS: Fisher链偏好性检验值, 使用Fisher精确检验计算正负链reads分布的偏好性# FS > 60.0表示存在明显的链偏好性gatk Varian...
# 使用SelectVariants,选出SNPtime/Tools/common/bin/gatk/4.0.1.2/gatk SelectVariants\-select-type SNP\-V ../output/E.coli/E_coli_K12.vcf.gz\-O ../output/E.coli/E_coli_K12.snp.vcf.gz# 为SNP作硬过滤time/Tools/common/bin/gatk/4.0.1.2/gatk VariantFiltration\-V ../output/E.coli/E_co...
我分染色体执行GATK硬过滤的时候出现发现输出文件显著小于原文件,报错内容如下 (base)[jychu@localhost chr_hardf gatk VariantFiltration-R/public/jychu/refs/Gallus_gallus.GRCg6a.dna.toplevel.fa-V chr2-1_typed.snp.vcf--filter-expression" QUAL < 30.0 || QD < 2.0 || MQ < 40.0 || FS > 60.0 ...
gatk VariantFiltration -R genome.fasta -O variants.filter.vcf -V variants.raw.vcf --filter-name FilterQual --filter-expression "QUAL < 30.0" --filter-name FilterQD --filter-expression "QD < 13.0" --filter-name FilterMQ --filter-expression "MQ < 20.0" --filter-name FilterFS --filter-...
这一步的目的就是对上一步call出来的变异位点进行过滤,去掉不可信的位点。这一步可以有两种方法,一种是通过GATK的VariantFiltration,另一种是通过GATK的VQSR(变异位点质量值重新校正)进行过滤。 通过GATK网站上提供的最佳方案可以看出,GATK是推荐使用VASR的,但使用VQSR数据量一定要达到要求,数据量太小无法使用高斯模型...
gatk VariantFiltration\-V SNPs.vcf\-filter"QD < 2.0"--filter-name"QD2"\-filter"QUAL < 30.0"--filter-name"QUAL30"\-filter"SOR > 3.0"--filter-name"SOR3"\-filter"FS > 60.0"--filter-name"FS60"\-filter"MQ < 40.0"--filter-name"MQ40"\-filter"MQRankSum < -12.5"--filter-name"MQ...
这一步的目的就是对上一步call出来的变异位点进行过滤,去掉不可信的位点。这一步可以有两种方法,一种是通过GATK的VariantFiltration,另一种是通过GATK的VQSR(变异位点质量值重新校正)进行过滤。 通过GATK网站上提供的最佳方案可以看出,GATK是推荐使用VASR的,但使用VQSR数据量一定要达到要求,数据量太小无法使用高斯模型...
相比于VQSR,采用hard-filter对raw vcf文件相对简单许多,主要采用QD, FS以及ReadPosRankSum参数对突变位点进行过滤,当且仅当QD<2,FS>200, ReadPosRankSum< -20时,该突变位点被保留。 $gatkVariantFiltration\-R~/gatk_files/human_g1k_v37.fasta \-Vhg020304_INDEL.vcf.gz \-Ooutput_INDEL...
$ gatk VariantFiltration -R hifi_fill.scaff_seqs.fasta -V /home/liuxin/output/filtering/snps.vcf -O /home/liuxin/output/filtering/snps.filtered.vcf --filter-name"QD_filter"-filter"QD < 2.0"--filter-name"FS_filter"-filter"FS > 60.0"--filter-name"MQ_filter"-filter"MQ < 40.0"--filter...