leles 2 --recode --out SNP #直接vcftools过滤和转换成plink格式,在转换过程中自动的只保留了 bi-allelic 位点。 vcftools --vcf Bra.snp.filter.pass.vcf --max-missing 0.9 --plink --out SNP 参考: http://vcftools.sourceforge.net/man_0112a.html...
vcftools --vcf DP3g95p5maf05.fil5.vcf --recode-INFO-all --out DP3g95p5maf05.FIL --max-meanDP 102.5 --exclude-positions DP3g95p5maf05.fil5.lowQDloci --recode 最后,VCFtools在可能的9164位点中保留了8417个。 这个教程主要是展示了如果从多角度进行过滤的可能性,但实际上很多paper 或者project...
一、计算每个SNP缺失频率 获得的SNP_missing结果,最后一栏为缺失率:二、过滤掉缺失率大于10%和非bi-allelic 基因 三、第二种简单的方法 参考:http://vcftools.sourceforge.net/man_0112a.html
不同的数据测序深度,样本数量都不一样,灵活调整参数;
两种方法都是可以的,不过大多数文章用GATK
首先做一个过滤, 我们将只保留已那些变异,至少50%的个体成功被snp calling的位点,最低质量分数为30的位点,次要等位基因计数为3的位点。 vcftools --gzvcf raw.vcf.gz --max-missing 0.5 --mac 3 --minQ 30 --recode --recode-INFO-all --out raw.g5mac3 ...