##执行以上命令获取out.miss文件,其中包括染色体、SNP名称 N_MISS(缺失个数)、 N_GENO(总个数)、 F_MISS(缺失率) ##插句题外话:mawk '$5 > 0.5' out.imiss | cut -f1 > lowDP.indv 获取缺失数据超过50%的个体,如果想删除或保留,参考第一个需求 --hardy ##计算Hardy-Weinberg值(虽然见过很多次,但...
vcftools --vcf filter_snp_indel.vcf --remove-filtered-all --recode --recode-INFO-all --out pass_snp_indel 进行了过滤标记的文件(filter_snp_indel.vcf) 5,为每个位点输出Hardy-Weinberg p值 vcftools --vcf all.SNP.vcf --hardy --max-missing 1.0 --out all_snp_hardy # --hardy 计算Hardy-We...
--hwe2.5 计算Hardy-Weinberg p-value讲到如何求p值,这个参数就是根据p值来过滤的,小于阈值则被过滤掉 --max-missing 前面已经举例;--max-missing-count 某个位点缺失样本个数多于某个阈值则过滤掉 --phased 某个位点如果含有未定相的基因型则过滤 --minQ 根据vcf文件的QUAL列来过滤,比如 vcftools --gzvcf ...
4.将新的vcf文件输出到标准输出,没有任何具有过滤器标记的位点,然后使用gzip压缩它 vcftools--gzvcf input_file.vcf.gz--remove-filtered-all--recode--stdout|gzip-c>output_PASS_only.vcf.gz AI代码助手复制代码 5.为bcf文件中的每个站点输出Hardy-Weinberg p值,该站点没有任何缺失的基因型 vcftools--bcfinpu...
vcftools是一种可以对VCF文件和BCF文件进行格式转换及过滤的工具,其中很多过滤及计算功能我们可以自己使用perl或者python编写脚本实现,但都不如这个工具的运算速度快。 有些奇怪的是需要到网页上查看他的使用参数,Linux上没有参数查看 参考:vcftools使用手册
–max-maf MAF最大值过滤 此处省去很多参数,具体参见vcftools官网 根据基因型数值过滤 –min-meanDP –max-meanDP 根据测序深度进行过滤 –hwe Assesses sites for Hardy-Weinberg Equilibrium using an exact test, as defined by Wigginton, Cutler and Abecasis (2005). Sites with a p-value below the thresh...
根据ALLELE过滤 –maf MAF最小值过滤 –max-maf MAF最大值过滤 此处省去很多参数,具体参见vcftools官网 根据基因型数值过滤 –min-meanDP –max-meanDP 根据测序深度进行过滤 –hwe Assesses sites for Hardy-Weinberg Equilibrium using an exact test, as defined by Wigginton, Cutler and Abecasis (2005). Sit...