说明: –gzvcf:处理压缩格式的vcf文件(可替换为–vcf) –chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 output.vcf.gz:将结果输出到output.vcf.gz --max-missing...
--recode:输出一个重新编码的VCF文件。 --recode-INFO-all:在重新编码的VCF文件中包含所有INFO字段。 5. 检查输出文件 运行完命令后,检查生成的输出文件(如output.vcf),确认指定位置的SNP已被正确提取。 示例位置文件(positions.txt) text 1:123456 2:654321 X:789012 示例VCF文件(data.vcf.gz的部分内容,解压...
去除sample01样本变异信息 vcftools --vcf sample.vcf --recode --recode-INFO-all \ --stdout --remove-indv sample01 > out.vcf # 根据文本文件保留样本变异信息 vcftools --vcf sample.vcf --recode --recode-INFO-all \ --stdout --keep sample_name.txt > out.vcf # sample_name.txt内容 # ...
vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 只保留1和10号两个样品,执行以下代码: vcftools--vcfin.vcf--recode--recode-INFO-all--stdout--indv1--indv10> out.vcf AI代码助手复...
vcftools --vcf test.vcf --chr chr1 --from-bp 1000000 --to-bp 2000000 --recode --recode-INFO-all --out result Writing out to screen 用--stdout or -c可以重定位所有输出到标准输出,可以通过管道输出给别的软件或者直接输入到某个输出文件。
vcf 文件中很多snp在某些样品中是缺失的,也就是基因型为 "./." 。如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 运行以下命令: vcftools --vcf snp.vcf --recode --recode-INFO-all --stdout --max-missing...
vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 下图为原始vcf文件。 只保留1和10号两个样品,执行以下代码: vcftools --vcf in.vcf --recode --recode-INFO-all --stdout --indv 1-...
vcftools --vcf snp.vcf --recode --recode-INFO-all --stdout --max-missing 1 > snp.new.vcf --max-missing 后跟的值为 0-1 ,1代表不允许缺失,0代表允许全部缺失 最后,得到的vcf文件中snp位点都是没有缺失的。 此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下: ...
vcftools --vcf filter_snp_indel.vcf --remove-filtered-all --recode --recode-INFO-all --stdout > pass_snp_indel.vcf # --remove-filtered-all,删除所有FILTER标志而不是PASS标志的位点, # --stdout,使文件可以重定向,如果里需要压缩文件这里就可以配合管道符使用 #如果这里不需要压缩可以这样写: vcftool...
–gzvcf:处理压缩格式的vcf文件(可替换为–vcf)–chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 --max-missing --max-missing的取值是0-1,...