利用vcftools进行vcf文件过滤 在GWAS分析之前,一般需要对基因型文件进行过滤,包括:缺失率、MAF、杂合率、双等位、仅SNP等。 运用bcftools进行进行双等位和仅SNP的过滤; bcftools view-m2-M2-v snps input.vcf.gz-Oz-ooutput.vcf.gz--threads20 bcftools支持多线程,速度快; -m2 -M2 指定输出双等位位点; -v snp...
--from-bp INT,--to-bp, 需和--chr一起使用,指定区域 --positions FILE,--exclude-positions 接tab分割的多个坐标位置文件 --bed FILE,--exclude-bed 根据BED文件进行过滤 根据指定ID位点过滤 --snp 根据vcf文件第三列ID列的snp名进行过滤。 --snps FILE,--exclude 根据ID文件进行过滤 变异类型过滤 --ke...
--freq ## 后面不加数字表示单纯计算输出等位基因频率,不是按照等位基因频率进行过滤 ## --freq --chr 1 计算1号染色体等位基因频率 --missing-indv ##[针对个体进行过滤]--vcftools --vcf+文件名 -missing-ind ##执行以上命令获取out.miss文件,其中包括染色体、SNP名称 N_MISS(缺失个数)、 N_GENO(总个...
vcftools --vcf filter_snp_indel.vcf --remove-filtered-all --recode --recode-INFO-all --out pass_snp_indel 进行了过滤标记的文件(filter_snp_indel.vcf) 5,为每个位点输出Hardy-Weinberg p值 vcftools --vcf all.SNP.vcf --hardy --max-missing 1.0 --out all_snp_hardy # --hardy 计算Hardy-We...
vcftools是一种可以对VCF文件和BCF文件进行格式转换及过滤的工具,其中很多过滤及计算功能我们可以自己使用perl或者python编写脚本实现,但都不如这个工具的运算速度快。目前官网的版本是vcftools v0.1.13。 中文版本:https://www.jianshu.com/p/badd24cbc538 ...
不同的数据测序深度,样本数量都不一样,灵活调整参数;
vcf 文件中很多snp在某些样品中是缺失的,也就是基因型为 "./." 。如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 运行以下命令: vcftools--vcfsnp.vcf--recode--recode-INFO-all--stdout--max-missing1> snp....
一、计算每个SNP缺失频率 获得的SNP_missing结果,最后一栏为缺失率:二、过滤掉缺失率大于10%和非bi-allelic 基因 三、第二种简单的方法 参考:http://vcftools.sourceforge.net/man_0112a.html
$catdepth_summary.txt#INDV N_SITES MEAN_DEPTH#cbp 12114 124.526 2、群体vcf文件过滤 参见SNP Filtering Tutorial 教程写得非常详尽 3、计算allele, depth, LD, pi, fst, TajimaD, SNP density等统计参数 具体使用案例待补充,或可参考manual 未完待续...
我正在尝试建立一个工作流程来分析我的scRNA-seq数据。我使用的是GATK和samtools、vcftools、bcftools的组合。我想过滤我的.vcf文件,这样它就可以删除读取次数少于10次的所有条目。看起来vcftools可以用来做这个。我的代码是: vcftools --vcf "$fn" --out ...