使用vcftools提取指定位置的SNP是一个常见的生物信息学任务。下面是一个详细的步骤指南,包括如何准备文件、运行命令以及检查结果。 1. 准备VCF文件和包含指定位置信息的文件 VCF文件:这是一个包含基因组变异信息的文件,通常以.vcf或.vcf.gz为扩展名。 位置文件:这是一个包含你感兴趣的位置(如染色体、起始位置和结束...
bcftools或vcftools提取指定区段的vcf文件(extract specified position ) 下载安装bcftools 见如下命令: bcftools filter 1000Genomes.vcf.gz --regions 9:4700000-4800000 > 4700000-4800000.vcf 注意:输入的vcf以gz格式存在,不然会报错:Failed to open 1000Genomes.vcf: not compressed with bgzip 如何将vcf生成gz格...
因为最近有一项工作是比较填充准确性的,中间有用到vcftools比较两个vcf文件. 使用命令也很简单: 1 vcftools --vcf file1.snp.vcf --diff file2.snp.vcf --diff-site --out Diff.site 运行结束会生成一个名为Diff.site.diff.sites_in_files的文件: pso1,ref1和alt1代表file1.snp.vcf文件中位点信息,IN_...