利用vcftools进行vcf文件过滤 在GWAS分析之前,一般需要对基因型文件进行过滤,包括:缺失率、MAF、杂合率、双等位、仅SNP等。 运用bcftools进行进行双等位和仅SNP的过滤; bcftools view-m2-M2-v snps input.vcf.gz-Oz-ooutput.vcf.gz--threads20 bcftools支持多线程,速度快; -m2 -M2 指定输出双等位位点; -v snp...
当支持参考等位基因的所有reads是paired但不支持备用等位基因时,会出现问题,所以要将其过滤。 mawk '!/#/' DP3g95p5maf05.fil4.vcf | wc -l 9166 可以看到,我们的位点数量逐渐减少,但我们的信噪比不断增加。 额外的过滤步骤 因为reads不是随机分布在contigs上的,所以可以进一步过滤,首先:删除任何质量得分低于深...
--freq ## 后面不加数字表示单纯计算输出等位基因频率,不是按照等位基因频率进行过滤 ## --freq --chr 1 计算1号染色体等位基因频率 --missing-indv ##[针对个体进行过滤]--vcftools --vcf+文件名 -missing-ind ##执行以上命令获取out.miss文件,其中包括染色体、SNP名称 N_MISS(缺失个数)、 N_GENO(总个...
vcf 文件中很多snp在某些样品中是缺失的,也就是基因型为 "./." 。如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 运行以下命令: vcftools--vcfsnp.vcf--recode--recode-INFO-all--stdout--max-missing1> snp.n...
4,筛选符合过滤的位点 5,为每个位点输出Hardy-Weinberg p值 安装直接用conda install vcftools vcftools支持.vcf文件和其二进制格式文件.bcf,这些文件里面是经过筛选后的SNP位点信息或indel信息 SNP位点的vcf文件 官方文档: VCFtoolsvcftools.github.io/man_latest.html#AUTHORS ...
vcftools过滤指定缺失率的变异位点 vcf 文件中很多snp在某些样品中是缺失的,也就是基因型为 "./." 。如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 下图为原始vcf文件。
vcftools过滤变异类型 vcf文件中可能会同时是包含snp以及indel两种变异类型,如果想将其分开,可利用vcftools实现。 具体用法如下: 下图为原始vcf文件(raw.vcf),可以看到包含indel以及snp。 过滤掉indel,只保留snp--remove-indels。 执行以下命令: vcftools --remove-indels --recode --recode-INFO-all --vcf raw.vcf...
一、计算每个SNP缺失频率 获得的SNP_missing结果,最后一栏为缺失率:二、过滤掉缺失率大于10%和非bi-allelic 基因 三、第二种简单的方法 参考:http://vcftools.sourceforge.net/man_0112a.html
vcftools是一种可以对VCF文件和BCF文件进行格式转换及过滤的工具,其中很多过滤及计算功能我们可以自己使用perl或者python编写脚本实现,但都不如这个工具的运算速度快。目前官网的版本是vcftools v0.1.13。 中文版本:https://www.jianshu.com/p/badd24cbc538 ...
vcftools是一种可以对VCF文件和BCF文件进行格式转换及过滤的工具,其中很多过滤及计算功能我们可以自己使用perl或者python编写脚本实现,但都不如这个工具的运算速度快。 基本参数 输入参数 –vcf 支持v4.0、v4.1或者v4.2版本的VCF文件 –gzvcf 通过gzipped压缩过的VCF文件 –bcf BCF2文件 输出参数 –out ...