一、计算每个SNP缺失频率 获得的SNP_missing结果,最后一栏为缺失率:二、过滤掉缺失率大于10%和非bi-allelic 基因 三、第二种简单的方法 参考:http://vcftools.sourceforge.net/man_0112a.html
vcftools 过滤等位基因。 老师,用的同样是vcftools过滤indel snp后生成的vcf.gz,然后进行等位基因过滤,...
indel的过滤1/2/3 步骤进行过滤嘛? 过滤1:gatk VariantFiltration过滤2:vcfutils.pl过滤3:vcftools。
vcftools --vcf DP3g95p5maf05.fil5.vcf --recode-INFO-all --out DP3g95p5maf05.FIL --max-meanDP 102.5 --exclude-positions DP3g95p5maf05.fil5.lowQDloci --recode 最后,VCFtools在可能的9164位点中保留了8417个。 这个教程主要是展示了如果从多角度进行过滤的可能性,但实际上很多paper 或者project...
首先做一个过滤, 我们将只保留已那些变异,至少50%的个体成功被snp calling的位点,最低质量分数为30的位点,次要等位基因计数为3的位点。 vcftools --gzvcf raw.vcf.gz --max-missing 0.5 --mac 3 --minQ 30 --recode --recode-INFO-all --out raw.g5mac3 ...
leles 2 --recode --out SNP #直接vcftools过滤和转换成plink格式,在转换过程中自动的只保留了 bi-allelic 位点。 vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9 --plink --out SNP 参考: http://vcftools.sourceforge.net/man_0112a.html...