–recode-INFO –recode-INFO-all These options can be used with the above recode options to define an INFO key name to keep in the output file. This option can be used multiple times to keep more of the INFO fields. The second option is used to keep all INFO values in the original fi...
vcftools --vcf raw.g5mac3dp3.recode.vcf --remove lowDP.indv --recode --recode-INFO-all --out raw.g5mac3dplm 然后该文章的原作者非常贴心的, 我们可以将变异限制为在高百分比的个体中,并通过基因型的平均深度进行过滤。 vcftools --vcf raw.g5mac3dplm.recode.vcf --max-missing 0.95 --maf 0...
vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 只保留1和10号两个样品,执行以下代码: vcftools--vcfin.vcf--recode--recode-INFO-all--stdout--indv1--indv10> out.vcf AI代码助手复...
–gzvcf:处理压缩格式的vcf文件(可替换为–vcf) –chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 output.vcf.gz:将结果输出到output.vcf.gz --max-missing --max...
vcf 文件中很多snp在某些样品中是缺失的,也就是基因型为 "./." 。如果缺失率较高,这种snp位点在很多分析中是不能用的,需要去掉。这时候就可以使用vcftools进行过滤。用到的选项为--max-missing。 具体用法如下: 运行以下命令: vcftools--vcfsnp.vcf--recode--recode-INFO-all--stdout--max-missing1> snp....
vcftools可以去除或保留vcf文件中的样品,用到的选项为--indv 和--remove-indv,指定要从vcf文件中保留或删除的样品。 可以多次使用此选项来指定多个样品。 具体用法如下: 下图为原始vcf文件。 只保留1和10号两个样品,执行以下代码: vcftools --vcf in.vcf --recode --recode-INFO-all --stdout --indv 1-...
–gzvcf:处理压缩格式的vcf文件(可替换为–vcf)–chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 --max-missing --max-missing的取值是0-1,...
说明: –gzvcf:处理压缩格式的vcf文件(可替换为–vcf) –chr n:选择染色体n,例:–chr 1 –recode:重新编码为vcf文件,有过滤操作都要加上--recode –recode-INFO-all:将输出的文件保存所有INFO信息 –stdout:标准输出,后接管道命令 –gzip -c:压缩 ...
去除sample01样本变异信息vcftools --vcf sample.vcf --recode --recode-INFO-all\--stdout --remove-indv sample01 > out.vcf# 根据文本文件保留样本变异信息vcftools --vcf sample.vcf --recode --recode-INFO-all\--stdout --keep sample_name.txt > out.vcf# sample_name.txt内容# sample01# sample...
vcftools --vcf snp.vcf --recode --recode-INFO-all --stdout --max-missing 1 > snp.new.vcf --max-missing 后跟的值为 0-1 ,1代表不允许缺失,0代表允许全部缺失 最后,得到的vcf文件中snp位点都是没有缺失的。 此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下: ...