然后,我们将此文件反馈到VCFtools以删除任何基因座。 vcftools --vcf DP3g95maf05.recode.vcf --exclude-positions badloci --recode --recode-INFO-all --out DP3g95p5maf05 同样,我们只有两个个体,所以我们的过滤可以过滤这些。然而,在多地点采样的研究就不能像这样处理了。
2、vcftools提取多个指定位置(不是一段区域)的vcf文件 如果只想提取指定多个独立位置(specific position)的基因型(genotypes),则可以用到vcftools工具 (此段感谢健明兄特意提出来,语言描述的不是很清楚。) 命令行如下: 1 vcftools --gzvcffile.vcf.gz --positions specific_position.txt --recode --out specific...
-bed –exclude-positions 3.合并vcf 样本的合并: vcf-merge NA14624-100-1_gatk-ug.vcf.gz NA14624-100-1_gatk-ug.vcf.gz >merge_vcf 几个样本的合并,每个样本占有一列 位点的合并(可以多个样本的合并) vcf-concat A.vcf.gz B.vcf.gz C.vcf.gz | gzip -c > out.vcf.gz ...